Meta New AI Speech Model: मार्क जुकरबर्ग की मेटा ने आर्टिफिशियल इंटेलिजेंस यानी AI स्पीच रिकग्निशन के क्षेत्र में एक महत्वपूर्ण मॉडल लॉन्च किया है जिसका नाम ओमनीलिंगुअल ऑटोमैटिक स्पीच रिकग्निशन (Omnilingual ASR) है। इसे भाषा और एआई के संयोजन के क्षेत्र में एक क्रांतिकारी मॉडल बताया जा रहा है जो उन लोगों के लिए AI स्पीच का उपयोग संभव बनाता है जो केवल अपनी क्षेत्रीय या दुर्लभ भाषाएं जानते हैं और अंग्रेजी या अन्य प्रमुख भाषाएं नहीं बोलते हैं। आइये जानते हैं क्या है ये-
AI स्पीच मॉडल के कुछ प्रमुख फायदे
- अब आप अपनी लोकल लैंग्वेज में एआई से सवाल कर पाएंगे
- अब हर भाषा बोलने वाला शख्स AI टेक्नीक का फायदा उठा सकेगा
- यह अब लोकल जनसंख्या को भी आसानी से मदद कर सकेगा और उनके सवालों के जवाब उन्हीं की भाषा में दे पाएगा
- नया मॉडल कई दुर्लभ भारतीय भाषाओं और बोलियों को भी सपोर्ट करेगा
- मेटा का यह नया मॉडल AI स्पीच की पहुंच को कई गुना तक बढ़ाने वाला होगा
स्पीच मॉडल की मुख्य विशेषताओं के बारे में जानें
इस मॉडल की मुख्य विशेषताओं में एक और बात ये है कि इसमें कई दुर्लभ भारतीय बोलियां भी शामिल हैं जिनकी मदद से पुरानी, प्राचीन और कम होती जा रही भाषाओं के लिए भी ये मॉडल काम करने में पूरी तरह सक्षम है। इसके अलावा मौजूदा भाषाएं जैसे हिंदी, बांग्ला, तमिल से लेकर छत्तीसगढ़ी और अवधि तक के उच्चारण को भी समझ सकता है। इसकी मदद से जो लोकल लैंग्वेज के सहारे अपना काम करते हैं, उन तक मेटा का एआई मॉडल अपनी पहुंच बनाएगा।
Meta का दावा है कि यह दुनिया का पहला ऐसा AI मॉडल है जो 1600 से अधिक भाषाओं और बोलियों को समझ सकता है और पहचान सकता है। ये 1600+ भाषाएं और बोलियाां तो समझेगा ही, इनके साथ ही दुर्लभ और कम संसाधन वाली भाषाएं समझना इस मॉडल की सबसे बड़ी खासियत है। ऐसा इसलिए कह रहे हैं क्योंकि इसमें 500 से अधिक ऐसी भाषाओं को शामिल किया गया है जिनके बहुत कम डिजिटल रिकॉर्ड या संसाधन मौजूद हैं। समावेशी AI के सिद्धांत पर यह काम करता है और कंपनी ने इस नए सिस्टम को ओपन सोर्स के रूप में पेश किया है जिससे डेवलपर्स और शोधकर्ता इसका उपयोग और सुधार कर सकते हैं।
कैसे काम करता है Meta का नया वॉइस रिकग्निशन टूल्स
Meta के मौजूदा वॉइस रिकग्निशन टूल्स जो मुख्य रूप से अंग्रेजी जैसी चुनिंदा बड़ी भाषाओं तक सीमित थे, इनके विपरीत यह नया ओमनीलिंगुअल ASR सिस्टम एक व्यापक दृष्टिकोण अपनाता है। प्रशिक्षण डेटा के लिहाज से देखें तो आमतौर पर, AI मॉडल को विशिष्ट भाषाओं के बड़े डेटासेट पर प्रशिक्षित किया जाता है। लेकिन कम संसाधन वाली भाषाओं के लिए यह डेटा उपलब्ध नहीं होता। Meta ने इस चुनौती को दूर करने के लिए शायद ऐसी तकनीकों का उपयोग किया है जो विभिन्न भाषाओं के बीच समानताएं ढूंढती हैं या बहुत कम डेटा से सीखने में सक्षम होती हैं।
यह मॉडल एक ही ढांचे के भीतर कई भाषाओं को संसाधित करने में सक्षम है जिससे यह विभिन्न प्रकार के भाषाई इनपुट को पहचानता है और उनमें उत्तर भी दे सकता है यानी मल्टीलिंगुअल मॉडल पर यह काम कर सकता है। कुल मिलाकर देखा जाए तो यह मॉडल भाषाई समावेशिता की दिशा में एक बड़ा कदम है जिसका उद्देश्य AI तकनीक को दुनिया भर के व्यापक यूजर्स बेस तक पहुंचाना है, भले ही वे कोई भी भाषा या बोली बोलते हों।
यह भी पढ़ें
Samasung Galaxy Z TriFold दिसंबर में इस तारीख को हो सकता है लॉन्च, यहां लीक हो गई डेट