बेंगलुरु की AI कंपनी Gnani AI ने अपना नया स्पीच-टू-टेक्स्ट मॉडल, 'Prisma v2.5' लॉन्च किया है। यह मॉडल खास तौर पर भारतीय भाषाओं और शोर-शराबे वाले माहौल के लिए तैयार किया गया है, जिसमें **1.4 करोड़** घंटे के खास भारतीय डेटा का इस्तेमाल हुआ है। इसका मकसद देश के 'सॉवरेन AI' लक्ष्यों को पूरा करना है।
क्या हुआ खास?
Gnani AI, जो वॉयस-फर्स्ट टेक्नोलॉजी पर काम करती है, ने अपना लेटेस्ट स्पीच-टू-टेक्स्ट मॉडल 'Prisma v2.5' पेश किया है। यह टेक्नोलॉजी भारतीय भाषाओं को ग्लोबल मॉडल से कहीं ज़्यादा सटीकता से समझने के लिए बनाई गई है, क्योंकि अक्सर विदेशी मॉडल भारत के भाषाई माहौल की चुनौतियों से जूझते हैं। कंपनी का दावा है कि इस मॉडल को 12 भाषाओं (जैसे हिंदी, तमिल, तेलुगु और कई क्षेत्रीय बोलियां) के 1.4 करोड़ घंटे के खास इंडिक स्पीच डेटा पर ट्रेन किया गया है। कंपनी का कहना है कि शोर-शराबे वाले और असल जिंदगी की स्थितियों में टेस्टिंग के दौरान, इसके वर्ड एरर रेट (गलतियों की दर) में ग्रामीण हिंदी बोलियों के लिए 15% और द्रविड़ भाषाओं के लिए 18% की कमी आई है।
निवेशकों के लिए क्यों है अहम?
भारतीय AI इकोसिस्टम के लिए यह डेवलपमेंट 'सॉवरेन AI' की ओर एक बड़ा कदम है। इसका मतलब है कि देश के अंदर ही ऐसी AI टेक्नोलॉजी विकसित करना जो डेटा सिक्योरिटी सुनिश्चित करे और स्थानीय ज़रूरतों के हिसाब से परफॉरमेंस दे। आमतौर पर ग्लोबल AI मॉडल स्टूडियो क्वालिटी डेटा पर ट्रेन होते हैं, जो भारतीय टेलीफोनी या कस्टमर सपोर्ट कॉल्स के शोर-शराबे और कोड-स्विच्ड (क्षेत्रीय भाषाओं के साथ अंग्रेजी का मिश्रण) माहौल को नहीं दर्शाते।busy बैकग्राउंड ट्रैफिक या खराब नेटवर्क क्वालिटी जैसी 'असल दुनिया' की दिक्कतों को हल करके, Gnani AI भारतीय कंपनियों, खासकर बैंकिंग, इंश्योरेंस और टेलीकॉम जैसे सेक्टरों की एक बड़ी समस्या को टारगेट कर रही है। इस खास जगह में कामयाबी हासिल करना एक बड़ा बिज़नेस एडवांटेज साबित हो सकता है, क्योंकि कंपनियां जनरल-पर्पस AI से हटकर खास, हाई-एक्यूरेसी टूल्स की ओर बढ़ रही हैं।
बड़ा बिज़नेस परिदृश्य
Gnani AI ने हाल ही में $10 मिलियन की सीरीज़ B फंडिंग जुटाई है, जिसमें Aavishkaar Capital ने लीड किया और मौजूदा निवेशक Info Edge Ventures ने भी भाग लिया। इस पैसे का इस्तेमाल कंपनी अपने इंफ्रास्ट्रक्चर को बढ़ाने और ग्लोबल मार्केट में अपनी मौजूदगी का विस्तार करने के लिए करेगी। यह कंपनी एक एंटरप्राइज SaaS प्रोवाइडर के तौर पर काम करती है, जिसका फोकस रेवेन्यू जेनरेट करने वाले एप्लीकेशन जैसे ऑटोमेटेड कस्टमर सपोर्ट और वॉयस-आधारित एनालिटिक्स पर है। ऐसे सेक्टर में जहाँ कई AI कंपनियां हाई कॉस्ट और स्पष्ट मोनेटाइजेशन की कमी से जूझ रही हैं, Gnani AI का एंटरप्राइज-ग्रेड, रिकरिंग रेवेन्यू मॉडल पर ध्यान देना इसे भारत के डीप-टेक स्पेस में एक परिपक्व प्लेयर के तौर पर स्थापित करता है।
सेक्टर का दबाव और मार्केट डायनामिक्स
भारत में कन्वर्सेशनल AI मार्केट तेज़ी से बढ़ रहा है, और अनुमान है कि 2034 तक इसमें ज़बरदस्त ग्रोथ देखने को मिलेगी। हालांकि, इस सेक्टर में कड़ी प्रतिस्पर्धा है। स्टार्टअप्स सिर्फ Microsoft या OpenAI जैसे ग्लोबल दिग्गजों से ही नहीं, बल्कि Sarvam AI जैसे घरेलू AI प्लेयर्स की बढ़ती लहर से भी मुकाबला कर रहे हैं। सभी के लिए मुख्य चुनौती कम-लेटेंसी वाले माहौल में हाई एक्यूरेसी हासिल करना है। कई ग्लोबल मॉडल हाई-स्पीड इंटरनेट और शांत माहौल के लिए डिज़ाइन किए गए हैं; जो भारतीय कंपनियां AI क्षमता और भारतीय इंफ्रास्ट्रक्चर की असलियतों - जैसे अस्थिर कनेक्टिविटी और अलग-अलग एक्सेंट - के बीच की खाई को सफलतापूर्वक पाटती हैं, वे बड़े एंटरप्राइज क्लाइंट्स के बीच तेज़ी से अपनी जगह बना रही हैं।
निवेशक क्या ट्रैक करें?
AI सेक्टर पर नज़र रखने वाले निवेशक इस बात पर ध्यान दे सकते हैं कि BFSI और टेलीकॉम जैसे बड़े, रेगुलेटेड इंडस्ट्रीज द्वारा इन मॉडल्स को कितनी प्रभावी ढंग से अपनाया जाता है। एक महत्वपूर्ण बात यह होगी कि कंपनी बड़े पैमाने पर उच्च सटीकता बनाए रखते हुए इन मॉडलों को चलाने की लागत को कैसे नियंत्रित करती है। इसके अलावा, डेटा सॉवरेन्टी और सरकार के IndiaAI मिशन से संबंधित रेगुलेटरी अपडेट्स भी महत्वपूर्ण बने रहेंगे, क्योंकि ये तय कर सकते हैं कि स्वदेशी मॉडलों को सरकारी और निजी क्षेत्र की परियोजनाओं में कितनाpreferential ट्रीटमेंट या इंटीग्रेशन मिलेगा। आखिर में, कंपनी अपने रेवेन्यू को कैसे बढ़ाती है और R&D खर्चों को कैसे संतुलित करती है, यह देखना भारत के वॉयस-फर्स्ट एंटरप्राइज AI मॉडल की लॉन्ग-टर्म व्यवहार्यता का एक मजबूत संकेतक होगा।
