இந்தியாவில் உள்ள ஸ்டார்ட்அப் நிறுவனங்கள், ரோபோக்களுக்கு பயிற்சி அளிக்க மனிதர்களின் அன்றாட வேலைகளை வீடியோவாக பதிவு செய்து வருகின்றன. இது 'Physical AI' உலகில் இந்தியாவை முக்கிய இடமாக மாற்றினாலும், தனியுரிமை (Privacy) மற்றும் ஒழுங்குமுறை (Regulatory) சிக்கல்கள் பெரும் சவாலாக உருவெடுத்துள்ளன.
என்ன நடக்கிறது?
இந்தியாவில் ஒரு புதிய வகை AI ஸ்டார்ட்அப்கள், 'egocentric' அல்லது முதல் நபர் டேட்டாவை சேகரிப்பதில் தீவிரமாக ஈடுபட்டுள்ளன. இதற்காக, கம்பெனிகள் பல லட்சக்கணக்கான கிக் தொழிலாளர்களை (Gig Workers) பணியமர்த்தி, தொழிற்சாலைகள், ஹோட்டல்கள் மற்றும் வீடுகளில் நடக்கும் அன்றாட வேலைகளான சமையல், சுத்தம் செய்தல், துணி தைத்தல், சரக்குகளை வரிசைப்படுத்துதல் போன்றவற்றை கையடக்க கேமராக்கள் அல்லது ஹெட்செட் சாதனங்கள் மூலம் பதிவு செய்கின்றன.
நவீன AI-யில் உள்ள ஒரு முக்கிய பிரச்சனையை தீர்ப்பதே இதன் நோக்கம். இணையத்தில் கொட்டிக்கிடக்கும் டெக்ஸ்ட் டேட்டாவை கொண்டு Large Language Models (LLMs) பயிற்றுவிக்கப்பட்டாலும், ரோபோக்களால் வெறும் டெக்ஸ்ட்டை மட்டும் கொண்டு கற்க முடியாது. நிஜ உலகத்துடன் மனிதர்கள் எவ்வாறு தொடர்பு கொள்கிறார்கள் என்பதற்கான உயர்தரமான டேட்டா அவர்களுக்கு தேவைப்படுகிறது. Neocambrian AI, Humyn Labs, Human Archive போன்ற ஸ்டார்ட்அப்கள், ரோபோக்கள் மற்றும் AI சிஸ்டம்களுக்கு பயிற்சி அளிக்க இந்த நடத்தை சார்ந்த டேட்டாவின் மிகப்பெரிய களஞ்சியங்களை உருவாக்க முயல்கின்றன.
முதலீட்டாளர்களுக்கு இது ஏன் முக்கியம்?
இந்த வளர்ச்சி, உலகளாவிய AI சப்ளை செயினில் ஒரு முக்கிய மாற்றத்தை குறிக்கிறது. இது வழக்கமான டிஜிட்டல் டேட்டா அனோடேஷனில் இருந்து, 'Physical AI' என்ற சிறப்புத் துறைக்கு நகர்கிறது. தொழில்நுட்ப துறையை கண்காணிக்கும் முதலீட்டாளர்கள் கவனிக்க வேண்டிய விஷயம் என்னவென்றால், இந்த டேட்டாவிற்கான தேவை உலகெங்கிலும் உள்ள முன்னணி ரோபோடிக்ஸ் நிறுவனங்களிடமிருந்து வருகிறது. மனிதர்களின் இயக்கத்தை பதிவு செய்யும் இந்த செயல்முறையை தொழிற்சாலைமயமாக்குவதன் மூலம், எதிர்கால ஹ்யூமனாய்டு ரோபோக்கள் மற்றும் தானியங்கி இயந்திரங்களுக்கான தரமான பயிற்சி மெட்டீரியலாக இது மாறும் என கம்பெனிகள் நம்புகின்றன.
இந்திய சந்தைக்கு, இது ஒரு வளர்ந்து வரும் சிறப்புப் பகுதியாக அமைகிறது. அதிக மக்கள் தொகை, பன்முகத்தன்மை வாய்ந்த நிஜ உலக சூழல்கள் மற்றும் மேலாண்மை சேவைகளில் உள்ள அனுபவம் ஆகியவற்றின் காரணமாக இந்தியா குறிவைக்கப்படுகிறது. இந்த மாடல் வெற்றிகரமாக செயல்பட்டால், இந்தியாவின் உலகளாவிய பேக்-ஆபிஸ் மையமாக இருக்கும் பங்கு, அடுத்த தலைமுறை ரோபோக்களுக்கான ஒரு சிறப்பு டேட்டா-உள்கட்டமைப்பு வழங்குநராக விரிவடையக்கூடும்.
முதலீட்டாளர்கள் இதை எப்படி பார்க்கலாம்?
தொழில்நுட்ப ரீதியாக இதன் சாத்தியம் அதிகமாக இருந்தாலும், இது வழக்கமான IT சேவைகள் போன்றதல்ல. இந்தத் துறை தற்போது பெரும்பாலும் தனியார் ஸ்டார்ட்அப்கள் மற்றும் ஆரம்பகட்ட நிறுவனங்களால் ஆதிக்கம் செலுத்தப்படுகிறது. இந்த வணிக மாதிரியானது நீண்ட கால நம்பகத்தன்மையை பாதிக்கக்கூடிய தனித்துவமான சவால்களை எதிர்கொள்கிறது. பரந்த தொழில்நுட்பம் மற்றும் AI துறையை கண்காணிக்கும் முதலீட்டாளர்கள், இந்த நிறுவனங்கள் உடல் ரீதியான டேட்டா சேகரிப்பின் அதிக செயல்பாட்டு செலவுகளை எவ்வாறு கையாள்கின்றன என்பதை கவனிக்க வேண்டும். இதற்கு ஹார்டுவேர், ஸ்டோரேஜ் மற்றும் ஒரு பெரிய பரவலாக்கப்பட்ட பணியாளர் குழு தேவைப்படுகிறது.
தனியுரிமை மற்றும் ஒழுங்குமுறை ஆபத்து
இந்தத் தொழில்துறையின் மிக முக்கியமான தடைக்கல்லாக இருப்பது தனியுரிமை குறித்த பொதுமக்களின் எதிர்ப்பு. சமீபத்தில், ஒரு வீட்டுச் சேவை ஸ்டார்ட்அப் வீடுகளுக்குள் பதிவு செய்ததாக பொதுமக்களின் விசாரணைக்கு உட்பட்டது, இது இந்த வேலையின் தீவிர உணர்திறனை எடுத்துக்காட்டுகிறது. தெளிவான, தகவலறிந்த ஒப்புதல் இல்லாமல் தனிப்பட்ட, பொது இடங்களைப் பதிவு செய்வது, ஒழுங்குமுறை அமைப்புகள் மற்றும் பொதுமக்களின் கவனத்தை ஈர்க்கிறது.
இந்தத் துறையில் உள்ள ஸ்டார்ட்அப்கள் இப்போது இந்தியாவின் டிஜிட்டல் தனிநபர் தரவு பாதுகாப்பு (DPDP) சட்டம் மற்றும் பிற உலகளாவிய தனியுரிமை விதிமுறைகளை கவனமாக கையாள வேண்டும். இந்த டேட்டா எவ்வாறு சேகரிக்கப்படுகிறது, சேமிக்கப்படுகிறது மற்றும் பகிரப்படுகிறது என்பது குறித்த ஏதேனும் சட்ட அல்லது ஒழுங்குமுறை நடவடிக்கைகள், செயல்பாடுகளை திடீரென நிறுத்தலாம் அல்லது கம்பெனிகளுக்கு மிகப்பெரிய இணக்கச் செலவுகளை ஏற்படுத்தலாம். சர்ச்சைக்குரிய டேட்டா நடைமுறைகளின் அடிப்படையில் உருவாக்கப்பட்ட வணிக மாதிரிகள் திடீர் இடையூறு அல்லது நற்பெயருக்கு சேதம் விளைவிக்கும் அபாயத்தை எதிர்கொள்கின்றன என்பதை முதலீட்டாளர்கள் அங்கீகரிக்க வேண்டும்.
டேட்டா அளவிடுதலில் உள்ள சவால்கள்
தனியுரிமைக்கு அப்பாற்பட்டு, டேட்டாவின் அளவிடுதல் மற்றும் தரத்தில் சவால்கள் உள்ளன. ரோபோக்களுக்கான 'தரமான' டேட்டா என்றால் என்ன என்பதை இந்தத் துறை இன்னும் வரையறுத்துக் கொண்டிருக்கிறது. தொழிலாளர் பாதுகாப்பு மற்றும் இழப்பீடு பற்றிய கேள்விகளும் உள்ளன. பலர் இந்த டேட்டாவை குறைந்த ஊதியத்துடன் கூடிய கிக் வேலை மூலம் உருவாக்குகிறார்கள், மேலும் தங்கள் சொந்த எதிர்கால வேலையிழப்பிற்கு தானியங்குமயமாக்க தங்கள் அன்றாட செயல்கள் பயன்படுத்தப்படுகின்றன என்பதை தொழிலாளர்கள் முழுமையாகப் புரிந்துகொள்கிறார்களா என்பதில் நெறிமுறை கவலைகள் உள்ளன.
முதலீட்டாளர்கள் அடுத்து என்ன கண்காணிக்க வேண்டும்?
AI சூழலியலில் ஆர்வமுள்ள முதலீட்டாளர்கள் மூன்று முக்கிய பகுதிகளை கண்காணிக்க வேண்டும். முதலாவதாக, இந்தியாவில் AI பயிற்சி டேட்டா தொடர்பான ஒழுங்குமுறை வழிகாட்டுதல்கள் குறித்த எந்தவொரு புதுப்பித்தல்களையும், குறிப்பாக வீடியோ கண்காணிப்பு மற்றும் தனிப்பட்ட இடங்கள் தொடர்பானவற்றைக் கண்காணிக்கவும். இரண்டாவதாக, வணிக மாதிரியின் பரிணாம வளர்ச்சியைக் கண்காணிக்கவும் - இது அளவில் நீடித்திருக்குமா, அல்லது அதிகரிக்கும் தொழிலாளர் மற்றும் இணக்கச் செலவுகள் லாப வரம்புகளைக் குறைக்குமா? இறுதியாக, 'செயற்கை டேட்டா' (synthetic data) அல்லது பிற தொழில்நுட்பங்களுக்குத் திரும்புவதைக் கவனிக்கவும். இது சர்ச்சைக்குரிய நிஜ உலக பதிவுகளுக்கான தேவையைக் குறைக்கக்கூடும், ஏனெனில் இது இந்த டேட்டா-தொழிற்சாலை வணிகங்களுக்கான தேவையை அடிப்படையில் மாற்றக்கூடும்.
