బెంగళూరుకు చెందిన Gnani AI, తాజాగా Prisma v2.5 అనే కొత్త స్పీచ్-టు-టెక్స్ట్ మోడల్ ను భారతీయ మార్కెట్ కోసం విడుదల చేసింది. ఇది 14 మిలియన్ గంటల ఇండిక్ డేటాపై శిక్షణ పొందింది. ముఖ్యంగా, భారతదేశంలోని నాయిసీ, బహుభాషా వాతావరణంలో కూడా కచ్చితంగా పనిచేసేలా దీన్ని రూపొందించారు. దేశ స్వదేశీ AI లక్ష్యాలకు ఇది మద్దతు ఇస్తుందని కంపెనీ చెబుతోంది. ఇటీవల $10 మిలియన్ల సిరీస్ B ఫండింగ్ ను అందుకున్న ఈ సంస్థ, బ్యాంకింగ్, టెలికాం వంటి రంగాలలో స్థానిక వాయిస్ సొల్యూషన్స్ కు పెరుగుతున్న డిమాండ్ ను తీర్చాలని లక్ష్యంగా పెట్టుకుంది.
అసలేం జరిగింది?
వాయిస్ టెక్నాలజీలో దూసుకుపోతున్న బెంగళూరు స్టార్టప్ Gnani AI, తమ సరికొత్త Prisma v2.5 స్పీచ్-టు-టెక్స్ట్ మోడల్ ను మార్కెట్లోకి తెచ్చింది. సాధారణ గ్లోబల్ మోడల్స్ తో పోలిస్తే, భారతీయ భాషల్లోని సవాళ్లను అధిగమించి, మరింత కచ్చితత్వంతో పనిచేసేలా దీన్ని తయారుచేశారు. కంపెనీ వెల్లడించిన వివరాల ప్రకారం, ఈ మోడల్ కు 12 భారతీయ భాషలతో సహా, 14 మిలియన్ గంటల ఇండిక్ స్పీచ్ డేటాపై శిక్షణ ఇచ్చారు. ముఖ్యంగా, గ్రామీణ హిందీ మాండలికాలకు 15% తక్కువ వర్డ్ ఎర్రర్ రేట్, ద్రావిడ భాషలకు 18% తక్కువ ఎర్రర్ రేట్ ను, శబ్దాలు ఎక్కువగా ఉండే నిజ జీవిత పరిస్థితుల్లో సాధించినట్లు కంపెనీ చెబుతోంది.
పెట్టుబడిదారులకు ఎందుకిది ముఖ్యం?
భారత AI రంగం 'సొంత AI' (Sovereign AI) వైపు అడుగులు వేస్తోందనడానికి ఇది ఒక నిదర్శనం. అంటే, దేశీయంగానే టెక్నాలజీని అభివృద్ధి చేయడం, డేటా భద్రతను పెంచడం, స్థానిక అవసరాలకు తగ్గట్టుగా పనితీరును మెరుగుపరచడం. గ్లోబల్ AI మోడల్స్ ను స్టూడియో క్వాలిటీ డేటాపై శిక్షణ ఇస్తారు. కానీ, భారతీయ టెలిఫోనీ లేదా కస్టమర్ సపోర్ట్ కాల్స్ లో ఉండే నాయిసీ, కోడ్-స్విచ్డ్ (ఇంగ్లీష్ తో పాటు స్థానిక భాషల మిశ్రమం) వాతావరణాన్ని అవి ప్రతిబింబించవు. బిజీ రోడ్లు, తక్కువ నెట్వర్క్ క్వాలిటీ వంటి 'నిజ జీవిత' సమస్యలను పరిష్కరించడం ద్వారా, Gnani AI బ్యాంకింగ్, ఇన్సూరెన్స్, టెలికాం వంటి రంగాలలో ఉన్న భారతీయ సంస్థలకు కీలకమైన సమస్యను పరిష్కరిస్తోంది. ఈ ప్రత్యేక రంగంలో విజయం సాధిస్తే, జనరల్ పర్పస్ AI నుండి స్పెషలైజ్డ్, హై-అక్యురసీ టూల్స్ వైపు మళ్లుతున్న కంపెనీలకు ఇది ఒక పెద్ద వ్యాపార అవకాశంగా మారొచ్చు.
విస్తృత వ్యాపార సందర్భం
ఇటీవల Gnani AI, Aavishkaar Capital నేతృత్వంలో, Info Edge Ventures సహకారంతో $10 మిలియన్ల సిరీస్ B ఫండింగ్ ను విజయవంతంగా పూర్తి చేసింది. ఈ నిధులను తమ మౌలిక సదుపాయాలను విస్తరించడానికి, ప్రపంచ మార్కెట్లలోకి ప్రవేశించడానికి ఉపయోగించాలని కంపెనీ యోచిస్తోంది. ఈ సంస్థ ప్రధానంగా ఎంటర్ప్రైజ్ SaaS ప్రొవైడర్ గా పనిచేస్తుంది, ఆటోమేటెడ్ కస్టమర్ సపోర్ట్, వాయిస్-బేస్డ్ అనలిటిక్స్ వంటి ఆదాయాన్నిచ్చే అప్లికేషన్లపై దృష్టి సారిస్తుంది. అధిక ఖర్చులు, స్పష్టత లేని మోనటైజేషన్ తో ఇబ్బంది పడే అనేక AI కంపెనీల మధ్య, Gnani AI యొక్క ఎంటర్ప్రైజ్-గ్రేడ్, రికరింగ్ రెవిన్యూ మోడల్స్ పై దృష్టి పెట్టడం, భారతదేశపు డీప్-టెక్ రంగంలో ఒక పరిణతి చెందిన ప్లేయర్ గా నిలుస్తోంది.
రంగం ఒత్తిడి & మార్కెట్ డైనమిక్స్
భారతదేశంలో కన్వర్సేషనల్ AI మార్కెట్ వేగంగా విస్తరిస్తోంది. 2034 వరకు బలమైన వృద్ధి ఉంటుందని అంచనాలున్నాయి. అయితే, ఈ రంగం తీవ్రమైన పోటీని ఎదుర్కొంటోంది. స్టార్టప్స్ మైక్రోసాఫ్ట్, OpenAI వంటి గ్లోబల్ దిగ్గజాలతో పాటు, Sarvam AI వంటి దేశీయ AI ప్లేయర్లతో కూడా పోటీ పడాల్సి వస్తోంది. అందరికీ ప్రధాన సవాలు తక్కువ లాటెన్సీ (Low Latency) తో కూడిన హై అక్యురసీని సాధించడం. చాలా గ్లోబల్ మోడల్స్ హై-స్పీడ్ ఇంటర్నెట్, నిశ్శబ్ద పరిసరాల కోసం రూపొందించబడ్డాయి. భారతీయ మౌలిక సదుపాయాల వాస్తవాలకు - అంటే అస్థిరమైన కనెక్టివిటీ, విభిన్న ఉచ్ఛారణలు - AI సామర్థ్యాన్ని అనుసంధానం చేయడంలో విజయవంతమైన కంపెనీలు, పెద్ద ఎంటర్ప్రైజ్ క్లయింట్లతో ఎక్కువగా ఆదరణ పొందుతున్నాయి.
ఇన్వెస్టర్లు ఏం గమనించాలి?
AI రంగంలో పెట్టుబడిదారులు, ఈ మోడల్స్ ను BFSI, టెలికాం వంటి పెద్ద, నియంత్రిత పరిశ్రమలు ఎంత సమర్థవంతంగా స్వీకరిస్తున్నాయో గమనించాలి. ముఖ్యంగా, అధిక అక్యురసీని స్కేల్ లో కొనసాగిస్తూ, ఈ మోడల్స్ ను నడపడానికి అయ్యే ఖర్చులను కంపెనీ ఎలా నియంత్రిస్తుందనేది కీలక పరిశీలన. అదనంగా, డేటా సార్వభౌమాధికారం (Data Sovereignty), ప్రభుత్వం యొక్క IndiaAI మిషన్ పై నియంత్రణ అప్డేట్స్ కూడా ముఖ్యమైనవి. ఎందుకంటే, దేశీయ మోడల్స్ కు ప్రభుత్వ, ప్రైవేట్ ప్రాజెక్టులలో ఎంత ప్రాధాన్యత లభిస్తుందో ఇవి నిర్దేశించగలవు. చివరిగా, R&D ఖర్చులను బ్యాలెన్స్ చేస్తూ, కంపెనీ తన ఆదాయాన్ని ఎలా స్కేల్ చేస్తుందో చూడటం, భారతదేశపు వాయిస్-ఫస్ట్ ఎంటర్ప్రైజ్ AI మోడల్ యొక్క దీర్ఘకాలిక సాధ్యాసాధ్యాలకు బలమైన సూచికగా ఉంటుంది.
