ट्राई-ईसीई योजना के माध्यम से लुप्तप्राय भाषाओं का संरक्षण एवं परिरक्षण
नई दिल्ली{ गहरी खोज }: भारत का भाषाई परिदृश्य दुनिया भर में सबसे विविध है, जहाँ 22 अनुसूचित भाषाएँ और सैकड़ों जनजातीय तथा क्षेत्रीय बोलियाँ इसके विशाल भौगोलिक क्षेत्रों में बोली जाती हैं। जैसे-जैसे डिजिटल बदलाव तेज़ हो रहा है, इस भाषाई विविधता को डिजिटल बुनियादी ढाँचे में समाहित करना बेहद ज़रुरी हो गया है। तकनीक अब केवल संचार का माध्यम नहीं रह गई है, यह आज समावेशन की रीढ़ है।
भारत सरकार कृत्रिम बुद्धिमत्ता (AI), प्राकृतिक भाषा प्रसंस्करण (एनएलपी), मशीन लर्निंग और वाक् पहचान जैसी उन्नत तकनीकों का इस्तेमाल करके बुद्धिमान और मापयोग्य भाषा समाधान विकसित कर रही है। इन पहलों का मकसद निर्बाध संचार, रीयल-टाइम अनुवाद, ध्वनि-सक्षम इंटरफेस और स्थानीयकृत सामग्री वितरण को सक्षम करके डिजिटल सेवाओं तक पहुँच को लोकतांत्रिक बनाना है। भाषाई विविधता का सम्मान करने वाले एक मज़बूत तकनीकी व्यवस्था तंत्र का निर्माण करके, भारत एक समावेशी डिजिटल भविष्य की नींव रख रहा है, जहाँ हर नागरिक, अपनी मातृभाषा के सहयोग से, डिजिटल अर्थव्यवस्था और शासन का हिस्सा बन सकेगा।
एआई-संचालित भाषा प्लेटफ़ॉर्म और विस्तृत डिजिटल रिपॉज़िटरी मौजूदा वक्त में भारतीय भाषाओं के संरक्षण, उपयोग और विकास के तरीके को नए सिरे से परिभाषित कर रहे हैं। भाषिणी और भारतजेन जैसे प्लेटफ़ॉर्म शासन, स्वास्थ्य सेवा और शिक्षा के क्षेत्र में बहुभाषी समर्थन प्रदान करते हैं। आदि-वाणी जैसी पहल आदिवासी भाषाओं को भी डिजिटल दायरे में लाती है। इस एकीकरण का मकसद यह देखना है कि भारत की भाषाई विरासत न केवल संरक्षित रहे, बल्कि डिजिटल युग में कार्यात्मक और गतिशील भी बनी रहे।
पिछले एक दशक में, कृत्रिम बुद्धिमत्ता, प्राकृतिक भाषा प्रसंस्करण और डिजिटल बुनियादी ढाँचे में हुई प्रगति ने भारत की भाषाई विविधता को दस्तावेजों में समेटने, डिजिटलीकृत और पुनर्जीवित करने की कोशिशों को रफ्तार दी है। इन तकनीकों ने सैकड़ों भाषाओं और बोलियों में बड़े पैमाने पर भाषा डेटा संग्रह, स्वचालित अनुवाद और वाक् पहचान को मुमकिन बनाया है, जिनमें से कई भाषाओं और बोलियों को पहले अपर्याप्त स्थान हासिल था। इस तकनीकी गति ने संचार के बाच के अंतराल को पाटने, समावेशी शासन को बढ़ावा देने और डिजिटल सामग्री को उनकी मूल भाषाओं में सुलभ बनाकर समुदायों को सशक्त बनाने में मदद की है।
2024 में स्थापित, आदि-वाणी भारत का पहला कृत्रिम बुद्धिमत्ता-संचालित प्लेटफ़ॉर्म है, जो जनजातीय भाषाओं के रीयल-टाइम अनुवाद और संरक्षण के लिए समर्पित है। अत्याधुनिक भाषा प्रौद्योगिकियों के ज़रिए संचार में क्रांति लाने के लिए डिज़ाइन किया गया, आदि-वाणी, कृत्रिम बुद्धिमत्ता की सटीकता को मानवीय भाषाई विशेषज्ञता के साथ जोड़कर सहज बहुभाषी अनुभव प्रदान करता है। मूलतः, आदि-वाणी उन्नत वाक् पहचान और प्राकृतिक भाषा प्रसंस्करण (एनएलपी) का उपयोग करके संथाली, भीली, मुंडारी और गोंडी जैसी भाषाओं का समर्थन करती है, जिनमें से कई पारंपरिक रूप से मौखिक संचार पर निर्भर रही हैं और जिनमें पर्याप्त डिजिटल प्रतिनिधित्व का अभाव रहा है। जनजातीय भाषाओं और प्रमुख भारतीय भाषाओं के बीच रीयल-टाइम अनुवाद को सक्षम करके, यह प्लेटफ़ॉर्म न केवल इन समृद्ध भाषाई परंपराओं को संरक्षित करता है, बल्कि उन्हें शिक्षा, शासन और सांस्कृतिक दस्तावेज़ीकरण के लिए भी सुलभ बनाता है।
शिक्षा मंत्रालय द्वारा 2013 में शुरू की गई और केंद्रीय भारतीय भाषा संस्थान (सीआईआईएल), मैसूर द्वारा कार्यान्वित, लुप्तप्राय भाषाओं का संरक्षण एवं परिरक्षण योजना (एसपीपीईएल) का मकसद लुप्तप्राय भारतीय भाषाओं, खासकर 10,000 से कम लोगों द्वारा बोली जाने वाली भाषाओं का दस्तावेजीकरण और डिजिटल संग्रह करना है।
यह समृद्ध लिखित रुप, ऑडियो और वीडियो डेटासेट तैयार करता है, जो संरक्षण और नवाचार दोनों में मदद करते हैं और एआई और प्राकृतिक भाषा प्रसंस्करण (एनएलपी) प्रणालियों के लिए महत्वपूर्ण संसाधन प्रदान करते हैं। सीआईआईएल का डिजिटल संग्रह, संचिका जैसे मंच, एआई मॉडल प्रशिक्षण, मशीन अनुवाद और सांस्कृतिक रूप से निहित भाषा प्रौद्योगिकियों के विकास पर ज़ोर देते हैं।
केंद्रीय भारतीय भाषा संस्थान द्वारा प्रबंधित, संचिका अनुसूचित और जनजातीय भाषाओं के लिए शब्दकोशों, प्राइमरों, कहानी-पुस्तकों और मल्टीमीडिया संसाधनों को एकत्रित करता है। यह केंद्रीकृत डिजिटल संग्रह, भाषा मॉडलों के प्रशिक्षण, अनुवाद प्रणालियों के विकास और सांस्कृतिक आख्यानों के संरक्षण के लिए एक महत्वपूर्ण डेटा स्रोत है।
यह मंच पाठ्य, श्रव्य और दृश्य सामग्री सहित भाषाई रूप से वर्गीकृत डिजिटल संसाधन प्रदान करता है, जो शैक्षणिक अनुसंधान, भाषा शिक्षा और सांस्कृतिक दस्तावेज़ीकरण में सहायता करते हैं। ये समृद्ध और विविध संग्रह उभरते कृत्रिम बुद्धिमत्ता और प्राकृतिक भाषा प्रसंस्करण अनुप्रयोगों के लिए आधारभूत डेटासेट प्रदान करते हैं, जिससे कम संसाधन वाली जनजातीय और क्षेत्रीय भाषाओं के लिए अधिक समावेशी और प्रभावी डिजिटल उपकरण संभव हो पाते हैं।
भारतजेन सभी 22 अनुसूचित भाषाओं के लिए उन्नत टेक्स्ट-टू-टेक्स्ट और टेक्स्ट-टू-स्पीच अनुवाद मॉडल विकसित करता है। यह एसपीपीईएल और संचिका के डेटा का उपयोग बहुभाषी एआई सिस्टम बनाने के लिए करता है, जो शासन, शिक्षा और स्वास्थ्य सेवा में अनुप्रयोगों को सशक्त बनाते हैं, ताकि डिजिटल सामग्री हर प्रमुख भारतीय भाषा में सुलभ हो सके।
भारतजेन के बहुभाषी एआई सिस्टम शासन, शिक्षा और स्वास्थ्य सेवा जैसे क्षेत्रों में डिजिटल पहुँच और समावेशिता को बढ़ाने के लिए डिज़ाइन किए गए हैं, जिससे भारत के विविध भाषाई परिदृश्य में निर्बाध संचार और सामग्री वितरण संभव हो सके।
सरकारी ई-मार्केटप्लेस (जेम) भारत का सार्वजनिक खरीद के लिए डिजिटल प्लेटफ़ॉर्म है, जिसे वाणिज्य एवं उद्योग मंत्रालय द्वारा 9 अगस्त 2016 को लॉन्च किया गया था। जेम सरकारी विभागों और सार्वजनिक क्षेत्र की संस्थाओं के लिए खरीद प्रक्रिया को सुव्यवस्थित करता है, पारदर्शिता और दक्षता सुनिश्चित करता है।
उपयोगकर्ताओ की पहुँच और समावेशिता को बढ़ाने के लिए, जेम ने जीईएमएआई, एक एआई-संचालित बहुभाषी सहायक, को एकीकृत किया है। जीईएमएआई कई भारतीय भाषाओं में ध्वनि और पाठ-आधारित समर्थन प्रदान करने के लिए उन्नत प्राकृतिक भाषा प्रसंस्करण (एनएलपी) और मशीन लर्निंग का लाभ उठाते हुए काम करता है। यह उपयोगकर्ताओं को विभिन्न मंचों पर खोज, नेविगेट और लेनदेन को अधिक आसानी से पूरा करने में सक्षम बनाता है, जिससे सरकारी खरीद में भाषा संबंधी बाधाओं को दूर करने में मदद मिलती है।
राष्ट्रीय भाषा अनुवाद मिशन (एनएलटीएम) के तहत भाषिणी, एक अग्रणी कृत्रिम बुद्धिमत्ता (एआई) प्लेटफ़ॉर्म है, जो 22 अनुसूचित भाषाओं और जनजातीय भाषाओं के लिए रीयल-टाइम अनुवाद को सक्षम बनाता है। यह सरकारी सेवाओं और डिजिटल सामग्री तक पहुँच को आसान बनाता है और मशीनी अनुवाद, वाक् पहचान और प्राकृतिक भाषा समझ के ज़रिए डिजिटल समावेशन को बढ़ावा देता है।
