अगवानी पृ-24
हिंदी कॉर्पोरा परियोजना
सूचना प्रौद्योगिकी मंत्रालय की भारतीय भाषाओं में प्रौद्योगिकी विकास संबंधित योजना के अंतर्गत केंद्रीय हिंदी संस्थान में वर्ष 1991 में 'हिंदी कॉर्पोरा परियोजना' का प्रारम्भ किया गया था। इस परियोजना के अंतर्गत संस्थान में वर्ष 1991 से 1993 के बीच हिंदी के तीस लाख शब्द का कॉर्पोरा विकसित किया गया। इस कार्य में 1980 से 1989 तक के साहित्य को आधार बनाकर विभिन्न विषयों एवं उपविषयों की सामग्री संकलित की गई। इस कार्य में आई.आई.टी. दिल्ली का सहयोग लिया गया। तदंतर समस्त कॉर्पोरा भारतीय भाषा संस्थान, मैसूर को अनुरक्षण एवं टैगिंग के लिए दे दिया गया। 1991 में सूचना प्रौद्योगिकी मंत्रालय ने आग्रह किया कि संस्थान हिंदी कॉर्पोरा को भारतीय भाषा संस्थान, मैसूर से लेकर टैगिंग का कार्य पूरा करे। संस्थान ने ई.आर. एण्ड डीई.सी.आई., नोएडा को सहयोगी एजेंसी बनाकर यह कार्य प्रारम्भ किया। विभिन्न कार्यशालाओं के आयोजन के माध्यम से हिंदी कॉर्पोरा का प्रूफ-शोधन किया गया और उसकी टैगिंग के नियम तैयार किए गये। इन नियमों का कंप्यूटरीकरण ई.आर. एण्ड डीई.सी.आई., नोएडा ने किया एवं इसकी सी.डी. तैयार कर सूचना प्रौद्योगिकी मंत्रालय को प्रस्तुत की गई। इस कॉर्पोरा के आधार पर इंडैक्स, विषयानुकूल बारंबारता आधारित कार्पोरा को विकसित करना है। परियोजना के दूसरे चरण में संस्थान ने अपने संसाधनों से इस कॉर्पोरा को दो करोड़ शब्दों तक ले जाने का कार्य प्रारम्भ किया है। वर्तमान में यह परियोजना भारतीय भाषा संस्थान, मैसूर के सहयोग से संचालित की जा रही है। वित्तीय वर्ष 2005-06 में इस कार्य को चरणबद्ध तरीके से प्रारम्भ किया गया है। परियोजना के संचालन के लिए निम्नलिखित क्रियाविधि निर्धारित की गई हैं-
|