Mukkaam Pune: OCR तंत्राच्या प्रतीक्षेत मराठी

जगात ३० कोटी लोकांना ओसीआरची प्रतिक्षा
OCR म्हणजे ऑप्टिकल कॅरॅक्टर रेकग्नीशन

संस्कृत, मराठी आणि हिंदी या भाषांतील सर्व अक्षरे (काही अपवाद वगळता) बहुतांशी सारखी आहेत.
मराठीतला ओसीआर अडकून पडला आणि हिंदीसाठी किंवा देवनागरीसाठी मात्र तो तयार झाला तरी तांत्रिक उसनवारी करून मराठीतलं ओसीआरचं काम होणं शक्य आहे.
मात्र मराठी आणि हिंदी दोन्हींसाठी किंवा एकूण देवनागरीसाठी वापरण्यास सोयीचे व स्वीकारार्ह असे ओसीआर सॉफ्टवेअर आज तरी शोधूनही सापडत नाही. मात्र आजही त्यातल्या बिनचूकपणाच्या मर्यादांमुळे त्याचा वापर वाढलेला दिसत नाही.

आजच्या घडीला अमेरिकेत न्युयॉर्कच्या बफेलो विद्यापीठात देवनागरी ओसीआरसाठी सातत्याने संशोधन करणारे एक स्वतंत्र केंद्र (Center of Excellence for Document Analysis and Recognition (CEDAR) आहे. त्याची माहिती जिज्ञासूंना http://www.cedar.buffalo.edu/script/Doverview.html या संकेतस्थळावरून घेता येईल.
भारताबाहेर देवनागरी ओसीआरसाठी काम करणाऱ्या बफेलो विद्यापीठासारख्या इतरही काही संस्था व व्यक्ती आहेत.
http://www.loksatta.com/lokprabha/20100305/my-marathi03.htm

Mukkaam Pune

June 13, 2010

OCR तंत्राच्या प्रतीक्षेत मराठी

No comments:

Post a Comment