June 13, 2010

OCR तंत्राच्या प्रतीक्षेत मराठी

 जगात ३० कोटी लोकांना ओसीआरची प्रतिक्षा
OCR म्हणजे ऑप्टिकल कॅरॅक्टर रेकग्नीशन


संस्कृत, मराठी आणि हिंदी या भाषांतील सर्व अक्षरे (काही अपवाद वगळता) बहुतांशी सारखी आहेत.
मराठीतला ओसीआर अडकून पडला आणि हिंदीसाठी किंवा देवनागरीसाठी मात्र तो तयार झाला तरी तांत्रिक उसनवारी करून मराठीतलं ओसीआरचं काम होणं शक्य आहे. 
मात्र मराठी आणि हिंदी दोन्हींसाठी किंवा एकूण देवनागरीसाठी वापरण्यास सोयीचे व स्वीकारार्ह असे ओसीआर सॉफ्टवेअर आज तरी शोधूनही सापडत नाही. मात्र आजही त्यातल्या बिनचूकपणाच्या मर्यादांमुळे त्याचा वापर वाढलेला दिसत नाही. 

आजच्या घडीला अमेरिकेत न्युयॉर्कच्या बफेलो विद्यापीठात देवनागरी ओसीआरसाठी सातत्याने संशोधन करणारे एक स्वतंत्र केंद्र (Center of Excellence for Document Analysis and Recognition (CEDAR) आहे. त्याची माहिती जिज्ञासूंना http://www.cedar.buffalo.edu/script/Doverview.html या संकेतस्थळावरून घेता येईल. 
भारताबाहेर देवनागरी ओसीआरसाठी काम करणाऱ्या बफेलो विद्यापीठासारख्या इतरही काही संस्था व व्यक्ती आहेत. 
http://www.loksatta.com/lokprabha/20100305/my-marathi03.htm

No comments:

Post a Comment