भारतातील स्टार्टअप्स आता रोबोट्सना जगात वावरण्यासाठी प्रशिक्षण देत आहेत. यासाठी ते लोकांच्या दैनंदिन कामांचे फर्स्ट पर्सन व्हिडिओ डेटा गोळा करत आहेत. यामुळे भारत 'फिजिकल AI' मध्ये महत्त्वाचा देश ठरू शकतो, पण यात गोपनीयता आणि नियामक पालनाचे मोठे धोकेही आहेत.
काय घडत आहे?
AI मधील स्टार्टअप्स आता 'डेटा फॅक्टरीज' उभारण्यात व्यस्त आहेत. ते 'एगोसेन्ट्रिक' किंवा फर्स्ट पर्सन डेटा गोळा करत आहेत. कंपन्या गिग वर्कर्सना कामावर ठेवून, कारखाने, हॉटेल्स आणि घरांमध्ये लोकांसाठी स्वयंपाक करणे, साफसफाई करणे, कपडे शिवणे किंवा मालाची वर्गवारी करणे यांसारख्या दैनंदिन क्रिया रेकॉर्ड करत आहेत. यासाठी वेअरेबल कॅमेरे किंवा हेड-माउंटेड डिव्हाइसेसचा वापर केला जात आहे.
यामागील मुख्य उद्देश AI मधील एक मोठी समस्या सोडवणे आहे. जिथे लार्ज लँग्वेज मॉडेल्स (LLMs) इंटरनेटवरील मोठ्या प्रमाणात उपलब्ध असलेल्या टेक्स्ट डेटावर प्रशिक्षित झाले, तिथे फिजिकल रोबोट्सना फक्त टेक्स्ट डेटाने शिकता येत नाही. त्यांना प्रत्यक्ष जगातील अव्यवस्थित आणि असंरचित वातावरणाशी मानव कसे संवाद साधतात, याचा उच्च-गुणवत्तेचा डेटा आवश्यक आहे. Neocambrian AI, Humyn Labs आणि Human Archive सारखे स्टार्टअप्स या गरजा पूर्ण करण्यासाठी मानवी वर्तनाचा प्रचंड डेटाबेस तयार करण्याचा प्रयत्न करत आहेत, जो रोबोट्स आणि AI सिस्टीम्सना प्रशिक्षित करेल.
गुंतवणूकदारांसाठी हे का महत्त्वाचे आहे?
हा विकास जागतिक AI पुरवठा साखळीतील एक महत्त्वाचा बदल दर्शवतो. हा बदल स्टँडर्ड डिजिटल डेटा ॲनोटेशनमधून 'फिजिकल AI' या विशेष क्षेत्रात होत आहे. तंत्रज्ञान क्षेत्रावर लक्ष ठेवणारे गुंतवणूकदार लक्षात घेतील की या डेटाची मागणी जगभरातील फ्रंटियर रोबोटिक्स कंपन्यांकडून येत आहे. मानवी हालचाली रेकॉर्ड करण्याच्या प्रक्रियेला औद्योगिक स्वरूप देणे, हे या व्यवसायाचे मॉडेल आहे. कंपन्यांना आशा आहे की हा डेटा ह्युमनॉइड रोबोट्स आणि ऑटोनॉमस मशीन्ससाठी प्रशिक्षणाचे मुख्य माध्यम बनेल.
भारतीय बाजारपेठेसाठी, हे एक नवीन क्षेत्र (niche) तयार करत आहे. भारतातील मोठी मनुष्यबळ उपलब्धता, विविध वास्तविक-जगातील वातावरण आणि व्यवस्थापित सेवांमधील अनुभव यामुळे भारताला लक्ष्य केले जात आहे. जर हे मॉडेल यशस्वी झाले, तर भारताची जागतिक बॅक-ऑफिस हब म्हणून असलेली भूमिका पुढच्या पिढीच्या रोबोटिक्ससाठी विशेष डेटा-इन्फ्रास्ट्रक्चर प्रदाता म्हणून वाढू शकते.
गुंतवणूकदार हे कसे पाहू शकतात?
तंत्रज्ञानाची क्षमता खूप जास्त असली तरी, हा पारंपरिक IT सेवांचा खेळ नाही. या क्षेत्रात सध्या खाजगी स्टार्टअप्स आणि सुरुवातीच्या टप्प्यातील कंपन्यांचे वर्चस्व आहे. या व्यवसायाच्या मॉडेलमध्ये काही खास आव्हाने आहेत, जी त्याच्या दीर्घकालीन व्यवहार्यतेवर परिणाम करू शकतात. व्यापक तंत्रज्ञान आणि AI क्षेत्रावर लक्ष ठेवणारे गुंतवणूकदार कंपन्या भौतिक डेटा संकलनाच्या उच्च परिचालन खर्चाचे व्यवस्थापन कसे करतात यावर लक्ष केंद्रित करतील. यामध्ये हार्डवेअर, स्टोरेज आणि मोठ्या प्रमाणात वितरित मनुष्यबळाचा समावेश आहे.
गोपनीयता आणि नियामक धोके
या उद्योगासमोरील सर्वात मोठे आव्हान म्हणजे गोपनीयतेचा (privacy) प्रश्न. अलीकडील घटना, जसे की एका घरगुती सेवा स्टार्टअपभोवती निर्माण झालेला वाद, ज्यावर घरात रेकॉर्डिंग केल्यामुळे टीका झाली होती, या कामातील तीव्र संवेदनशीलतेवर प्रकाश टाकतात. स्पष्ट आणि माहितीपूर्ण संमतीशिवाय खाजगी, वैयक्तिक जागांमध्ये रेकॉर्डिंग करणे, आता नियामकांचे आणि लोकांचे लक्ष वेधून घेत आहे.
या जागेतील स्टार्टअप्सना आता भारताच्या डिजिटल पर्सनल डेटा प्रोटेक्शन (DPDP) ॲक्ट आणि इतर जागतिक गोपनीयता नियमांचे पालन करावे लागेल. डेटा कसा गोळा केला जातो, संग्रहित केला जातो आणि शेअर केला जातो यावरील कोणतीही कायदेशीर किंवा नियामक कारवाईमुळे ऑपरेशन्स अचानक थांबवले जाऊ शकतात किंवा कंपन्यांना प्रचंड अनुपालन खर्च (compliance costs) करावा लागू शकतो. गुंतवणूकदारांनी हे लक्षात घेतले पाहिजे की संभाव्य वादग्रस्त डेटा पद्धतींवर आधारित व्यवसाय मॉडेल्सना अचानक व्यत्यय किंवा प्रतिष्ठेचे नुकसान होण्याचा धोका जास्त असतो.
डेटा स्केलिंगमधील आव्हाने
गोपनीयतेच्या पलीकडे, स्केलिंग आणि डेटा गुणवत्तेची आव्हाने आहेत. रोबोटसाठी 'गुणवत्तापूर्ण' डेटा काय आहे, हे उद्योग अजूनही परिभाषित करत आहे. कामगारांची सुरक्षा आणि मोबदल्याचा प्रश्नही आहे. टीकाकारांनी निदर्शनास आणले आहे की यातील बराचसा डेटा कमी वेतनाच्या गिग कामातून तयार होतो आणि कामगारांना हे पूर्णपणे समजते की त्यांच्या दैनंदिन क्रिया त्यांच्या भविष्यातील नोकऱ्या स्वयंचलित करण्यासाठी वापरल्या जात आहेत की नाही, याबद्दल नैतिक चिंता आहेत.
गुंतवणूकदारांनी पुढे काय पाहावे?
AI इकोसिस्टममध्ये स्वारस्य असलेल्या गुंतवणूकदारांनी तीन मुख्य क्षेत्रांवर लक्ष ठेवावे. प्रथम, भारतात AI प्रशिक्षण डेटाशी संबंधित नियामक मार्गदर्शक तत्त्वांमधील कोणत्याही अद्यतनांवर लक्ष ठेवा, विशेषतः व्हिडिओ पाळत ठेवणे (surveillance) आणि वैयक्तिक जागेसंबंधी. दुसरे, व्यवसाय मॉडेलच्या उत्क्रांतीवर लक्ष ठेवा - ते मोठ्या प्रमाणात टिकू शकेल की वाढता श्रम आणि अनुपालन खर्च मार्जिन कमी करेल? शेवटी, 'सिंथेटिक डेटा' किंवा इतर तंत्रज्ञानाकडे उद्योगातील बदल पहा, ज्यामुळे वादग्रस्त वास्तविक-जगातील रेकॉर्डिंगची गरज कमी होऊ शकते. कारण यामुळे या डेटा-फॅक्टरी व्यवसायांची मागणी मूलभूतपणे बदलू शकते.
