Whalesbook Logo

Whalesbook

  • Home
  • About Us
  • Contact Us
  • News

Pixa AI ने पेश किया Luna AI: रियल-टाइम, भावनात्मक रूप से इंटेलिजेंट स्पीच-टू-स्पीच मॉडल

Tech

|

30th October 2025, 4:16 PM

Pixa AI ने पेश किया Luna AI: रियल-टाइम, भावनात्मक रूप से इंटेलिजेंट स्पीच-टू-स्पीच मॉडल

▶

Short Description :

Pixa AI ने Luna AI लॉन्च किया है, जो एक अभूतपूर्व स्पीच-टू-स्पीच फाउंडेशनल मॉडल है जिसमें रियल-टाइम भावनात्मक प्रतिक्रियाएं, गायन और फुसफुसाने की क्षमता है। पारंपरिक सिस्टम के विपरीत, Luna AI सीधे ऑडियो को प्रोसेस करता है, जिससे लेटेंसी कम होती है और बातचीत की स्वाभाविकता बढ़ती है। इसका लक्ष्य अधिक मानव-जैसी बातचीत बनाना है और इसने सटीकता और भाषण की स्वाभाविकता के बेंचमार्क में अग्रणी प्रतिस्पर्धियों की तुलना में बेहतर प्रदर्शन दिखाया है। Pixa AI अपनी तकनीक को मनोरंजन, ऑटोमोटिव, AI खिलौनों, मानसिक स्वास्थ्य, शिक्षा और ग्राहक सेवा जैसे अनुप्रयोगों के लिए लाइसेंस देने की योजना बना रही है, जिसमें भविष्य में भारतीय भाषाओं के लिए बहुभाषी समर्थन भी शामिल होगा।

Detailed Coverage :

Pixa AI ने Luna AI पेश किया है, एक नया स्पीच-टू-स्पीच फाउंडेशनल मॉडल जिसे मानव-AI इंटरैक्शन में क्रांति लाने के लिए डिज़ाइन किया गया है। यह मॉडल पारंपरिक स्पीच-टू-टेक्स्ट और टेक्स्ट-टू-स्पीच रूपांतरण चरणों को बायपास करता है, सीधे ऑडियो को प्रोसेस करके स्पीच आउटपुट उत्पन्न करता है। यह सीधा ऑडियो प्रोसेसिंग लेटेंसी को काफी कम कर देता है, जिससे अधिक प्रतिक्रियाशील और स्वाभाविक बातचीत संभव होती है, जिसमें गायन, फुसफुसाहट और भावनात्मक उतार-चढ़ाव जैसी बारीकियां भी शामिल हैं।

Pixa AI के संस्थापक, स्पर्श अग्रवाल, इस बात पर जोर देते हैं कि Luna AI को 'भावनात्मक पहले' दृष्टिकोण के साथ बनाया गया है, जिसका लक्ष्य AI बातचीत को रोबोटिक के बजाय अधिक मानवीय महसूस कराना है। आंतरिक मूल्यांकन बताते हैं कि Luna AI अग्रणी रियल-टाइम सिस्टम से बेहतर है। ऑटोमेटिक स्पीच रिकग्निशन (ASR) में, इसने 5.24% की त्रुटि दर हासिल की, जो Deepgram Nova (8.38%) और ElevenLabs Scribe (5.81%) से बेहतर है। टेक्स्ट-टू-स्पीच वर्ड एरर रेट (TTS WER) के लिए, Luna AI ने 1.3% दर्ज किया, जो Sesame (2.9%) और GPT-4o TTS (3.2%) से बेहतर है। स्वाभाविकता के लिए इसका मीन ओपिनियन स्कोर (MOS) 4.62 था, जो GPT-real-time के 4.15 से अधिक है।

कंपनी लाइसेंसिंग-आधारित व्यापार मॉडल के माध्यम से B2B अनुप्रयोगों को सक्रिय रूप से आगे बढ़ा रही है, जिसमें मनोरंजन (यूरोपीय कंपनियों के साथ सहयोग), ऑटोमोटिव (इन-कार इंफोटेनमेंट सिस्टम के लिए), और AI खिलौने (एक अमेरिकी कंपनी के साथ) जैसे क्षेत्रों को लक्षित किया गया है। अन्य संभावित अनुप्रयोगों में मानसिक स्वास्थ्य परामर्श, बुजुर्गों के लिए साथ, और बच्चों की शिक्षा शामिल हैं। ग्राहक कॉल ऑटोमेशन के लिए एक बड़ी कंपनी के साथ किए गए पायलट में ग्राहक जुड़ाव और रूपांतरण दरों में वृद्धि देखी गई।

शुरुआत में अंग्रेजी का समर्थन करने के बाद, Luna AI तीन महीने के भीतर 12 प्रमुख भारतीय भाषाओं और अतिरिक्त वैश्विक भाषाओं के लिए बहुभाषी क्षमताओं को रोल आउट करने की योजना बना रही है। यह स्टार्टअप, जिसे निखिल कामत, कुणाल शाह और कुणाल कपूर सहित निवेशकों का समर्थन प्राप्त है, टीम विस्तार और GPU एक्सेस के लिए IndiaAI मिशन के साथ जुड़ने की भी योजना बना रही है।

प्रभाव: AI प्रौद्योगिकी में यह प्रगति आर्टिफिशियल इंटेलिजेंस और प्रौद्योगिकी क्षेत्रों को महत्वपूर्ण बढ़ावा दे सकती है। यह संवादात्मक AI अनुप्रयोगों के लिए नए रास्ते खोलती है, जिससे AI स्टार्टअप्स और कंपनियों में निवेश बढ़ सकता है, और विभिन्न उद्योगों में उपयोगकर्ता अनुभव बेहतर हो सकते हैं। Luna AI जैसे उन्नत AI मॉडल का विकास वैश्विक AI परिदृश्य में भारत की महत्वाकांक्षा के लिए महत्वपूर्ण है। रेटिंग: 7/10