Whalesbook Logo

Whalesbook

  • Home
  • About Us
  • Contact Us
  • News

Pixa AI ने सादर केले Luna AI: रिअल-टाइम, भावनिकदृष्ट्या बुद्धिमान स्पीच-टू-स्पीच मॉडेल

Tech

|

30th October 2025, 4:16 PM

Pixa AI ने सादर केले Luna AI: रिअल-टाइम, भावनिकदृष्ट्या बुद्धिमान स्पीच-टू-स्पीच मॉडेल

▶

Short Description :

Pixa AI ने Luna AI लॉन्च केले आहे, जे एक ग्राउंडब्रेकिंग स्पीच-टू-स्पीच फाउंडेशनल मॉडेल आहे, जे रिअल-टाइम भावनिक प्रतिसाद, गायन आणि कुजबुजण्यास सक्षम आहे. पारंपरिक सिस्टीमच्या विपरीत, Luna AI थेट ऑडिओवर प्रक्रिया करते, ज्यामुळे लेटेंसी कमी होते आणि संभाषणाची नैसर्गिकता वाढते. याचा उद्देश अधिक मानवी संवाद साधणे आहे आणि त्याने अचूकता व स्पीच नैसर्गिकतेच्या बेंचमार्कमध्ये आघाडीच्या स्पर्धकांपेक्षा उत्कृष्ट कामगिरी दाखवली आहे. Pixa AI आपली टेक्नॉलॉजी मनोरंजन, ऑटोमोटिव्ह, AI खेळणी, मानसिक आरोग्य, शिक्षण आणि ग्राहक सेवा यांसारख्या ॲप्लिकेशन्ससाठी परवाना देण्याची योजना आखत आहे, तसेच भविष्यात भारतीय भाषांसाठी बहुभाषिक समर्थन देखील उपलब्ध होईल.

Detailed Coverage :

Pixa AI ने Luna AI सादर केले आहे, जे मानवी-AI संवादामध्ये क्रांती घडवण्यासाठी डिझाइन केलेले एक नवीन स्पीच-टू-स्पीच फाउंडेशनल मॉडेल आहे. हे मॉडेल पारंपरिक स्पीच-टू-टेक्स्ट आणि टेक्स्ट-टू-स्पीच रूपांतरण टप्पे वगळते, थेट ऑडिओवर प्रक्रिया करून स्पीच आउटपुट तयार करते. ही थेट ऑडिओ प्रक्रिया लेटेंसी लक्षणीयरीत्या कमी करते, ज्यामुळे गायन, कुजबुजणे आणि भावनिक चढ-उतार यांसारख्या बारकावेंसह अधिक प्रतिसाद देणारे आणि नैसर्गिक संवाद शक्य होतात.

Pixa AI चे संस्थापक, स्पर्श अग्रवाल, यावर जोर देतात की Luna AI 'इमोशनल फर्स्ट' (emotional first) दृष्टिकोन वापरून तयार केले गेले आहे, ज्याचा उद्देश AI संभाषणांना रोबोटिकऐवजी अधिक मानवी अनुभव देणे आहे. अंतर्गत मूल्यांकनांनुसार, Luna AI आघाडीच्या रिअल-टाइम सिस्टीमपेक्षा सरस आहे. ऑटोमॅटिक स्पीच रेकग्निशन (ASR) मध्ये, त्याने 5.24% त्रुटी दर (error rate) साधला, जो Deepgram Nova (8.38%) आणि ElevenLabs Scribe (5.81%) पेक्षा चांगला आहे. टेक्स्ट-टू-स्पीच वर्ड एरर रेट (TTS WER) साठी, Luna AI ने 1.3% नोंदवले, जे Sesame (2.9%) आणि GPT-4o TTS (3.2%) पेक्षा चांगले आहे. नैसर्गिकतेसाठी याचा मीन ओपिनियन स्कोर (MOS) 4.62 होता, जो GPT-real-time च्या 4.15 पेक्षा जास्त आहे.

कंपनी परवाना-आधारित व्यवसाय मॉडेलद्वारे (licensing-led business model) B2B ॲप्लिकेशन्सवर सक्रियपणे काम करत आहे. मनोरंजन (युरोपियन कंपन्यांसोबत सहयोग), ऑटोमोटिव्ह (इन-कार इन्फोटेनमेंट सिस्टमसाठी) आणि AI खेळणी (US-आधारित कंपनीसोबत) यांसारख्या क्षेत्रांना लक्ष्य केले जात आहे. मानसिक आरोग्य समुपदेशन, वृद्धांसाठी सोबती आणि मुलांचे शिक्षण यांसारख्या इतर संभाव्य ॲप्लिकेशन्समध्ये यांचा समावेश आहे. ग्राहक कॉल ऑटोमेशनसाठी एका मोठ्या कंपनीसोबत केलेल्या पायलटमध्ये (pilot) ग्राहक प्रतिबद्धता (engagement) आणि रूपांतरण दरांमध्ये (conversion rates) वाढ दिसून आली.

सुरुवातीला इंग्रजीला सपोर्ट केल्यानंतर, Luna AI तीन महिन्यांत 12 प्रमुख भारतीय भाषांसाठी आणि अतिरिक्त जागतिक भाषांसाठी बहुभाषिक क्षमता (multilingual capabilities) सादर करण्याची योजना आखत आहे. निखिल कामत, कुणाल शाह आणि कुणाल कपूर यांसारख्या गुंतवणूकदारांचा पाठिंबा असलेल्या या स्टार्टअपमध्ये, टीमचा विस्तार करण्याची आणि GPU ऍक्सेससाठी IndiaAI मिशनसोबत सहकार्य करण्याची योजना देखील आहे.

परिणाम: AI तंत्रज्ञानातील ही प्रगती आर्टिफिशियल इंटेलिजेंस आणि तंत्रज्ञान क्षेत्रांना महत्त्वपूर्ण चालना देऊ शकते. यामुळे संवादात्मक AI ॲप्लिकेशन्ससाठी नवीन मार्ग खुले होतील, ज्यामुळे AI स्टार्टअप्स आणि कंपन्यांमधील गुंतवणूक वाढू शकते आणि विविध उद्योगांमधील वापरकर्ता अनुभव सुधारू शकतात. Luna AI सारख्या प्रगत AI मॉडेल्सचा विकास जागतिक AI लँडस्केपमध्ये भारताच्या महत्त्वाकांक्षेसाठी महत्त्वपूर्ण आहे. रेटिंग: 7/10