जगात ३० कोटी लोकांना ओसीआरची प्रतिक्षा
OCR म्हणजे ऑप्टिकल कॅरॅक्टर रेकग्नीशन
संस्कृत, मराठी आणि हिंदी या भाषांतील सर्व अक्षरे (काही अपवाद वगळता) बहुतांशी सारखी आहेत.
मराठीतला ओसीआर अडकून पडला आणि हिंदीसाठी किंवा देवनागरीसाठी मात्र तो तयार झाला तरी तांत्रिक उसनवारी करून मराठीतलं ओसीआरचं काम होणं शक्य आहे.
मात्र मराठी आणि हिंदी दोन्हींसाठी किंवा एकूण देवनागरीसाठी वापरण्यास सोयीचे व स्वीकारार्ह असे ओसीआर सॉफ्टवेअर आज तरी शोधूनही सापडत नाही. मात्र आजही त्यातल्या बिनचूकपणाच्या मर्यादांमुळे त्याचा वापर वाढलेला दिसत नाही.
आजच्या घडीला अमेरिकेत न्युयॉर्कच्या बफेलो विद्यापीठात देवनागरी ओसीआरसाठी सातत्याने संशोधन करणारे एक स्वतंत्र केंद्र (Center of Excellence for Document Analysis and Recognition (CEDAR) आहे. त्याची माहिती जिज्ञासूंना http://www.cedar.buffalo.edu/script/Doverview.html या संकेतस्थळावरून घेता येईल.
भारताबाहेर देवनागरी ओसीआरसाठी काम करणाऱ्या बफेलो विद्यापीठासारख्या इतरही काही संस्था व व्यक्ती आहेत.
http://www.loksatta.com/lokprabha/20100305/my-marathi03.htm
No comments:
Post a Comment