हायब्रिड इन्फरन्सकडे वाटचाल
Perplexity AI अत्याधुनिक मॉडेल्सच्या उपयोजनातील उच्च खर्च आणि जास्त लेटन्सीची समस्या सोडवण्यासाठी आपल्या उत्पादनाच्या आर्किटेक्चरमध्ये बदल करत आहे. 'हायब्रिड एजंटिक इन्फरन्स' (hybrid agentic inference) द्वारे, कंपनी टास्क प्रोसेसिंगला केंद्रीय क्लाउड क्लस्टरपासून वेगळे करत आहे. इंटेलसोबत COMPUTEX 2026 मध्ये प्रदर्शित केलेली ही रणनीती, स्थानिक हार्डवेअरवर (उदा. इंटेल कोर अल्ट्राचे NPU) प्रारंभिक स्क्रीनिंग आणि गोपनीयतेशी संबंधित ऑपरेशन्स करण्यासाठी डिझाइन केली आहे, तर जास्त पॅरामीटर्स असलेल्या कामांसाठी क्लाउडचा वापर केला जाईल. कंपनीचा मुख्य उद्देश प्रति क्वेरी (cost per query) खर्च कमी करणे हा आहे, कारण कंपनी वार्षिक $500 दशलक्ष महसूल मिळवण्याच्या दिशेने वाटचाल करत असताना, या खर्चामुळे कंपनीच्या मार्जिनवर दबाव येत आहे.
ऑपरेशनल ऑर्केस्ट्रेशन लेअर
Perplexity Computer आता एका ऑर्केस्ट्रेशन लेअरमध्ये विकसित होत आहे, जे आर्टिफिशियल इंटेलिजन्स वर्कलोडसाठी 'एअर-ट्रॅफिक कंट्रोलर' म्हणून काम करेल. हे 20 पर्यंतच्या विविध मॉडेल्सचे व्यवस्थापन करते आणि वापरकर्त्याच्या विनंतीची जटिलता व सुरक्षिततेच्या गरजेनुसार कामांना आपोआप राउट करते. ही केवळ एक नवीन सुविधा नाही, तर एक बचावात्मक रणनीती आहे. सामान्य सारांश आणि डेटा वर्गीकरणाची कामे एज (edge) वर हलवून, Perplexity महागड्या आणि जास्त वीज वापरणाऱ्या डेटा सेंटर कंप्युटवरील अवलंबित्व कमी करते. विशेषतः जेव्हा कंपनी फ्लॅट-रेट सबस्क्रिप्शनऐवजी वापर-आधारित किंमत मॉडेलकडे (usage-based pricing model) जात आहे, तेव्हा हे महत्त्वाचे ठरते. याद्वारे कंपनी पॉवर युजर्सकडून जास्त मूल्य मिळवण्याचा प्रयत्न करत आहे, त्याच वेळी पायाभूत सुविधांवरील खर्च व्यवस्थापित करत आहे.
कायदेशीर आणि संरचनात्मक धोके
इंटेलसोबतची भागीदारी तांत्रिकदृष्ट्या फायदेशीर ठरत असली तरी, Perplexity ला केवळ मॉडेलच्या कार्यक्षमतेपलीकडे जाऊन संरचनात्मक आव्हानांना सामोरे जावे लागत आहे. कंपनी सध्या किमान नऊ सक्रिय खटल्यांमध्ये गुंतलेली आहे. यामध्ये मोठ्या मीडिया कंपन्यांकडून कॉपीराइट आणि ट्रेडमार्क उल्लंघनाचे आरोप आहेत. या कायदेशीर अडचणींमुळे कंपनीच्या डेटा इन्जेशन पाइपलाइनमध्ये व्यत्यय येऊ शकतो आणि प्रशिक्षण पद्धतींमध्ये खर्चिक बदल करावे लागू शकतात. याव्यतिरिक्त, विविध महसूल स्त्रोत असलेल्या सिलिकॉन कंपन्यांप्रमाणे, Perplexity अजूनही एक खाजगी कंपनी आहे आणि तिला तिच्या 'Computer' एजंटद्वारे नफ्यात टिकून राहण्याची सिद्धता करण्याची प्रचंड गरज आहे. वापर-आधारित किमतींवर अवलंबून राहिल्याने अस्थिरता वाढते, कारण कंपनीला हायब्रिड इन्फरन्सच्या तांत्रिक गरजा आणि अनपेक्षित वापरकर्ता वर्तन तसेच विविध हार्डवेअर वातावरणास समर्थन देण्याचा उच्च खर्च यांच्यात संतुलन साधावे लागेल.
भविष्यातील दृष्टिकोन: एजंटिक युगाचा विस्तार
कंपनीच्या व्यवस्थापनाने या हायब्रिड व्हिजनसाठी आपली वचनबद्धता दर्शविली आहे आणि स्पष्ट केले आहे की 2028 पूर्वी कोणतीही सार्वजनिक लिस्टिंग अपेक्षित नाही. या लांबच्या कालावधीमुळे, 2026 च्या उर्वरित वर्षांसाठी ऑर्केस्ट्रेशन लेअरला अधिक मजबूत करणे आणि एंटरप्राइझ दत्तक वाढवण्यावर लक्ष केंद्रित केले जाईल. प्रतिस्पर्धी वेगाने स्वतःची एजंटिक रिझनिंग क्षमता एकत्रित करत असल्याने, Perplexity चे यश हे एज-क्लाउड हँडओव्हर (edge-cloud handover) अचूकतेशी तडजोड न करता अंमलात आणण्यावर अवलंबून असेल. इंटेलसोबतचे सध्याचे सहकार्य संपूर्ण उद्योगासाठी एक 'टेस्टबेड' आहे; जर ते यशस्वी झाले, तर ते येत्या वर्षांमध्ये ग्राहक हार्डवेअरवर AI शोध कसा वितरित केला जाईल याचा मापदंड ठरेल.
