बंगळूर स्थित Gnani AI ने 'Prisma v2.5' नावाचे नवीन स्पीच-टू-टेक्स्ट मॉडेल सादर केले आहे. हे मॉडेल भारतीय भाषांमधील **14 दशलक्ष तासांहून** अधिक डेटावर प्रशिक्षित केले गेले आहे. भारतातील गोंगाट आणि बहुभाषिक वातावरणातही उत्तम काम करण्यासाठी हे डिझाइन केले असून, देशाच्या 'सॉव्हरिन AI' उद्दिष्टांना पाठिंबा देण्याचे याचे ध्येय आहे. नुकत्याच मिळालेल्या **$10 दशलक्ष** Series B फंडिंगनंतर हे लॉन्च झाले आहे, जे बँकिंग आणि टेलिकॉमसारख्या क्षेत्रांतील व्हॉइस सोल्युशन्सच्या वाढत्या मागणीला दर्शवते.
काय घडले?
बंगळूरची व्हॉइस-फर्स्ट स्टार्टअप Gnani AI ने त्यांचे नवीन स्पीच-टू-टेक्स्ट मॉडेल, Prisma v2.5, लॉन्च केले आहे. हे तंत्रज्ञान जागतिक मॉडेल्सपेक्षा भारतीय भाषांवर अधिक अचूक प्रक्रिया करण्यासाठी तयार केले आहे, कारण अनेक जागतिक मॉडेल्सना भारतीय भाषिक वातावरणातील आव्हाने पेलताना अडचणी येतात. कंपनीच्या म्हणण्यानुसार, हे मॉडेल 12 भाषांमधील, ज्यात हिंदी, तामिळ, तेलुगु आणि इतर प्रादेशिक बोलींचा समावेश आहे, अशा 14 दशलक्ष तासांपेक्षा जास्त खास इंडिक स्पीच डेटावर प्रशिक्षित केले गेले आहे. कंपनीचा दावा आहे की, गोंगाट आणि प्रत्यक्ष वापरातील परिस्थितीत तुलना केल्यास, ग्रामीण हिंदी बोलींसाठी 15% कमी वर्ड एरर रेट (Word Error Rate) आणि द्रविडीयन भाषांसाठी 18% कमी एरर रेट या मॉडेलने नोंदवला आहे.
गुंतवणूकदारांसाठी याचे महत्त्व
भारतीय AI परिसंस्थेसाठी, हे 'सॉव्हरिन AI' (Sovereign AI) कडे एक महत्त्वाचे पाऊल आहे. याचा अर्थ, डेटा सुरक्षा आणि स्थानिक गरजांनुसार कार्यप्रदर्शन सुनिश्चित करण्यासाठी तंत्रज्ञान पायाभूत सुविधा देशातच विकसित करणे. अनेकदा जागतिक AI मॉडेल्स स्टुडिओ-गुणवत्तेच्या डेटावर प्रशिक्षित केले जातात, जे भारतीय टेलिफोनी किंवा ग्राहक सेवा कॉलच्या गोंगाटयुक्त आणि कोड-स्विच्ड (स्थानिक भाषांसोबत इंग्रजीचे मिश्रण) वातावरणाचे प्रतिबिंब दर्शवत नाहीत. व्यस्त पार्श्वभूमीतील ट्रॅफिक किंवा नेटवर्कच्या कमी गुणवत्तेसारख्या 'वास्तविक जगातील' परिस्थितींना संबोधित करून, Gnani AI बँकिंग, विमा आणि दूरसंचार यांसारख्या क्षेत्रांतील भारतीय उद्योगांसाठी एक महत्त्वाची समस्या सोडवत आहे. या विशिष्ट क्षेत्रात यश मिळवणे हे कंपन्या सामान्य-उद्देशीय AI कडून विशेष, उच्च-अचूकता साधनांवर जात असताना एक महत्त्वपूर्ण व्यावसायिक फायदा ठरू शकते.
मोठे व्यावसायिक संदर्भ
Gnani AI ने नुकतेच $10 दशलक्ष Series B फंडिंग मिळवले आहे, ज्याचे नेतृत्व Aavishkaar Capital ने केले आणि Info Edge Ventures सारख्या विद्यमान गुंतवणूकदारांनीही यात भाग घेतला. या भांडवलाचा उद्देश कंपनीला तिची पायाभूत सुविधा वाढवण्यासाठी आणि जागतिक बाजारपेठेतील उपस्थितीचा विस्तार करण्यासाठी मदत करणे आहे. ही कंपनी एक एंटरप्राइज SaaS प्रदाता म्हणून काम करते, जी स्वयंचलित ग्राहक समर्थन आणि व्हॉइस-आधारित विश्लेषण यांसारख्या महसूल-उत्पन्न करणाऱ्या ऍप्लिकेशन्सवर लक्ष केंद्रित करते. अनेक AI कंपन्या उच्च खर्च आणि अस्पष्ट कमाई मॉडेल्समुळे संघर्ष करत असताना, Gnani AI चे एंटरप्राइज-ग्रेड, आवर्ती महसूल मॉडेलवरील लक्ष तिला भारतातील डीप-टेक क्षेत्रातील एक परिपक्व खेळाडू म्हणून स्थापित करते.
क्षेत्रातील दबाव आणि बाजाराची गतिशीलता
भारतातील संवादात्मक AI (Conversational AI) बाजार वेगाने विस्तारत आहे, आणि 2034 पर्यंत मजबूत वाढीचा अंदाज आहे. तथापि, या क्षेत्रात तीव्र स्पर्धा आहे. स्टार्टअप्स केवळ Microsoft किंवा OpenAI सारख्या जागतिक दिग्गजांशीच नव्हे, तर Sarvam AI सारख्या देशांतर्गत AI खेळाडूंच्या वाढत्या लाटेशीही स्पर्धा करत आहेत. सर्व सहभागींसाठी मुख्य अडचण म्हणजे कमी-विलंब (low-latency) वातावरणात उच्च अचूकता प्राप्त करणे. अनेक जागतिक मॉडेल्स हाय-स्पीड इंटरनेट आणि शांत वातावरणासाठी डिझाइन केलेले आहेत; ज्या भारतीय कंपन्या AI क्षमता आणि भारतीय पायाभूत सुविधांच्या (उदा. अस्थिर कनेक्टिव्हिटी आणि विविध उच्चार) वास्तविकतेमधील अंतर यशस्वीरित्या भरून काढतात, त्या मोठ्या एंटरप्राइज ग्राहकांमध्ये अधिकाधिक लक्ष वेधून घेत आहेत.
गुंतवणूकदारांनी काय ट्रॅक करावे?
AI क्षेत्रावर लक्ष ठेवणारे गुंतवणूकदार मोठ्या, नियामक उद्योगांकडून (जसे BFSI आणि दूरसंचार) या मॉडेल्सचा किती प्रभावीपणे स्वीकार केला जातो यावर लक्ष ठेवतील. एका महत्त्वाच्या निरीक्षणात कंपनीची मोठ्या प्रमाणावर उच्च अचूकता राखण्याची क्षमता आणि त्याच वेळी या मॉडेल्स चालवण्याचा खर्च नियंत्रित करणे यांचा समावेश असेल. याव्यतिरिक्त, डेटा सार्वभौमत्व (Data Sovereignty) आणि सरकारच्या IndiaAI Mission संबंधित नियामक अद्यतने महत्त्वाची राहतील, कारण ते सार्वजनिक आणि खाजगी क्षेत्रातील प्रकल्पांमध्ये स्वदेशी मॉडेल्सना किती प्राधान्य किंवा एकत्रीकरण मिळेल हे ठरवू शकतात. शेवटी, कंपनी R&D खर्च संतुलित करताना तिचा महसूल कसा वाढवते याचे निरीक्षण करणे, हे भारतातील व्हॉइस-फर्स्ट एंटरप्राइज AI मॉडेलच्या दीर्घकालीन व्यवहार्यतेचे एक मजबूत सूचक असेल.
