Whalesbook Logo

Whalesbook

  • Home
  • About Us
  • Contact Us
  • News

Pixa AI દ્વારા Luna AIનું અનાવરણ: રિયલ-ટાઇમ, ભાવનાત્મક રીતે બુદ્ધિશાળી સ્પીચ-ટુ-સ્પીચ મોડેલ

Tech

|

30th October 2025, 4:16 PM

Pixa AI દ્વારા Luna AIનું અનાવરણ: રિયલ-ટાઇમ, ભાવનાત્મક રીતે બુદ્ધિશાળી સ્પીચ-ટુ-સ્પીચ મોડેલ

▶

Short Description :

Pixa AI એ Luna AI લોન્ચ કર્યું છે, જે એક ગ્રાઉન્ડબ્રેકિંગ સ્પીચ-ટુ-સ્પીચ ફાઉન્ડેશનલ મોડેલ છે જે રિયલ-ટાઇમ ભાવનાત્મક પ્રતિભાવો, ગાયન અને ગણગણાટ કરવા સક્ષમ છે. પરંપરાગત સિસ્ટમોથી વિપરીત, Luna AI સીધા ઓડિયોને પ્રોસેસ કરે છે, લેટન્સી ઘટાડે છે અને વાતચીતની સ્વાભાવિકતા વધારે છે. તેનો ઉદ્દેશ્ય વધુ માનવ-જેવા ઇન્ટરેક્શન્સ બનાવવાનો છે અને તેણે ચોકસાઈ અને સ્પીચની સ્વાભાવિકતાના બેન્ચમાર્કમાં અગ્રણી સ્પર્ધકો કરતાં શ્રેષ્ઠ પ્રદર્શન દર્શાવ્યું છે. Pixa AI તેની ટેકનોલોજીને મનોરંજન, ઓટોમોટિવ, AI રમકડાં, માનસિક સ્વાસ્થ્ય, શિક્ષણ અને ગ્રાહક સેવા જેવા એપ્લિકેશન્સ માટે લાઇસન્સ આપવાની યોજના ધરાવે છે, જેમાં ભવિષ્યમાં ભારતીય ભાષાઓ માટે મલ્ટિલિંગ્યુઅલ સપોર્ટ પણ સામેલ થશે.

Detailed Coverage :

Pixa AI એ Luna AI રજૂ કર્યું છે, જે માનવ-AI ઇન્ટરેક્શન્સમાં ક્રાંતિ લાવવા માટે રચાયેલ એક નવલકથા સ્પીચ-ટુ-સ્પીચ ફાઉન્ડેશનલ મોડેલ છે. આ મોડેલ પરંપરાગત સ્પીચ-ટુ-ટેક્સ્ટ અને ટેક્સ્ટ-ટુ-સ્પીચ કન્વર્ઝન સ્ટેપ્સને બાયપાસ કરે છે, સીધા ઓડિયોને પ્રોસેસ કરીને સ્પીચ આઉટપુટ જનરેટ કરે છે. આ ડાયરેક્ટ ઓડિયો પ્રોસેસિંગ લેટન્સીને નોંધપાત્ર રીતે ઘટાડે છે, જે ગાયન, ગણગણાટ અને ભાવનાત્મક અભિવ્યક્તિ જેવી સૂક્ષ્મતાઓ સાથે વધુ પ્રતિભાવશીલ અને સ્વાભાવિક વાતચીતને મંજૂરી આપે છે.

Pixa AI ના સ્થાપક, સ્પાર્શ અગ્રવાલે ભારપૂર્વક જણાવ્યું છે કે Luna AI 'ઇમોશન ફર્સ્ટ' (emotional first) અભિગમ સાથે બનાવવામાં આવ્યું છે, જેનો ઉદ્દેશ્ય AI વાર્તાલાપને રોબોટિકને બદલે વધુ માનવીય લાગે તેવો બનાવવાનો છે. આંતરિક મૂલ્યાંકનો સૂચવે છે કે Luna AI અગ્રણી રિયલ-ટાઇમ સિસ્ટમ્સ કરતાં શ્રેષ્ઠ છે. ઓટોમેટિક સ્પીચ રેકગ્નિશન (ASR) માં, તેણે 5.24% ભૂલ દર (error rate) પ્રાપ્ત કર્યો, જે Deepgram Nova (8.38%) અને ElevenLabs Scribe (5.81%) કરતાં વધુ સારું છે. ટેક્સ્ટ-ટુ-સ્પીચ વર્ડ એરર રેટ (TTS WER) માટે, Luna AI એ 1.3% રેકોર્ડ કર્યું, જે Sesame (2.9%) અને GPT-4o TTS (3.2%) કરતાં વધુ સારું છે. સ્વાભાવિકતા માટે તેનો મીન ઓપિનિયન સ્કોર (MOS) 4.62 હતો, જે GPT-real-time ના 4.15 કરતાં વધારે છે.

કંપની લાઇસન્સિંગ-લીડ બિઝનેસ મોડેલ (licensing-led business model) દ્વારા B2B એપ્લિકેશન્સ પર સક્રિયપણે કામ કરી રહી છે, જે મનોરંજન (યુરોપિયન કંપનીઓ સાથે સહયોગ), ઓટોમોટિવ (ઇન-કાર ઇન્ફોટેનમેન્ટ સિસ્ટમ્સ માટે) અને AI રમકડાં (US-આધારિત કંપની સાથે) જેવા ક્ષેત્રોને લક્ષ્ય બનાવે છે. અન્ય સંભવિત એપ્લિકેશન્સમાં માનસિક સ્વાસ્થ્ય સલાહ, વૃદ્ધો માટે સાથ અને બાળકોનું શિક્ષણ શામેલ છે. ગ્રાહક કોલ ઓટોમેશન માટે એક મોટી કંપની સાથે કરવામાં આવેલા પાયલોટ (pilot) પ્રોજેક્ટમાં ગ્રાહક જોડાણ (engagement) અને રૂપાંતરણ દરો (conversion rates) માં વધારો જોવા મળ્યો.

શરૂઆતમાં અંગ્રેજીને સપોર્ટ કર્યા પછી, Luna AI ત્રણ મહિનાની અંદર 12 મુખ્ય ભારતીય ભાષાઓ અને વધારાની વૈશ્વિક ભાષાઓ માટે મલ્ટિલિંગ્યુઅલ ક્ષમતાઓ (multilingual capabilities) બહાર પાડવાની યોજના ધરાવે છે. નિખિલ કામત, કુણાલ શાહ અને કુનલ કપૂર જેવા રોકાણકારો દ્વારા સમર્થિત આ સ્ટાર્ટઅપ, ટીમ વિસ્તરણ અને GPU ઍક્સેસ માટે IndiaAI મિશન સાથે જોડાણ કરવાની પણ યોજના ધરાવે છે.

અસર: AI ટેકનોલોજીમાં આ પ્રગતિ આર્ટિફિશિયલ ઇન્ટેલિજન્સ અને ટેકનોલોજી ક્ષેત્રોને નોંધપાત્ર પ્રોત્સાહન આપી શકે છે. તે કન્વર્ઝેશનલ AI એપ્લિકેશન્સ માટે નવા માર્ગો ખોલે છે, જે AI સ્ટાર્ટઅપ્સ અને કંપનીઓમાં રોકાણ વધારી શકે છે અને વિવિધ ઉદ્યોગોમાં વપરાશકર્તા અનુભવોને સુધારી શકે છે. Luna AI જેવા અદ્યતન AI મોડેલ્સનો વિકાસ વૈશ્વિક AI લેન્ડસ્કેપમાં ભારતના મહત્વકાંક્ષા માટે નિર્ણાયક છે. રેટિંગ: 7/10