जगात ३० कोटी लोकांना ओसीआरची प्रतिक्षा
OCR म्हणजे ऑप्टिकल कॅरॅक्टर रेकग्नीशन
संस्कृत, मराठी आणि हिंदी या भाषांतील सर्व अक्षरे (काही अपवाद वगळता) बहुतांशी सारखी आहेत.
मराठीतला ओसीआर अडकून पडला आणि हिंदीसाठी किंवा देवनागरीसाठी मात्र तो तयार झाला तरी तांत्रिक उसनवारी करून मराठीतलं ओसीआरचं काम होणं शक्य आहे.
मात्र मराठी आणि हिंदी दोन्हींसाठी किंवा एकूण देवनागरीसाठी वापरण्यास सोयीचे व स्वीकारार्ह असे ओसीआर सॉफ्टवेअर आज तरी शोधूनही सापडत नाही. मात्र आजही त्यातल्या बिनचूकपणाच्या मर्यादांमुळे त्याचा वापर वाढलेला दिसत नाही.
आजच्या घडीला अमेरिकेत न्युयॉर्कच्या बफेलो विद्यापीठात देवनागरी ओसीआरसाठी सातत्याने संशोधन करणारे एक स्वतंत्र केंद्र (Center of Excellence for Document Analysis and Recognition (CEDAR) आहे. त्याची माहिती जिज्ञासूंना http://www.cedar.buffalo.edu/script/Doverview.html या संकेतस्थळावरून घेता येईल.
भारताबाहेर देवनागरी ओसीआरसाठी काम करणाऱ्या बफेलो विद्यापीठासारख्या इतरही काही संस्था व व्यक्ती आहेत.
http://www.loksatta.com/lokprabha/20100305/my-marathi03.htm
June 13, 2010
Subscribe to:
Post Comments (Atom)
No comments:
Post a Comment