AI ਮਾਡਲ ਦੀ ਸੁਰੱਖਿਆ ਬਾਰੇ ਚਿੰਤਾਵਾਂ
AI ਕੰਪਨੀ Anthropic ਨੇ ਆਪਣੇ ਨਵੇਂ AI ਮਾਡਲ, Claude Mythos Preview, ਨੂੰ ਆਮ ਜਨਤਾ ਲਈ ਜਾਰੀ ਨਾ ਕਰਨ ਦਾ ਫੈਸਲਾ ਕੀਤਾ ਹੈ। ਇਹ ਫੈਸਲਾ ਮਾਡਲ ਦੀਆਂ ਸ਼ਕਤੀਸ਼ਾਲੀ ਸਾਈਬਰਸੁਰੱਖਿਆ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਲੈ ਕੇ ਅੰਦਰੂਨੀ ਸੇਫਟੀ ਟੈਸਟਿੰਗ ਦੌਰਾਨ ਪੈਦਾ ਹੋਈਆਂ ਗੰਭੀਰ ਚਿੰਤਾਵਾਂ ਕਾਰਨ ਲਿਆ ਗਿਆ ਹੈ। ਟੈਸਟਾਂ ਵਿੱਚ ਇਹ ਗੱਲ ਸਾਹਮਣੇ ਆਈ ਹੈ ਕਿ Mythos, ਉੱਚ-ਕੁਸ਼ਲਤਾ ਵਾਲੇ ਸੁਰੱਖਿਆ ਖੋਜਕਰਤਾਵਾਂ ਦੇ ਬਰਾਬਰ ਸੌਫਟਵੇਅਰ ਕਮਜ਼ੋਰੀਆਂ (Software Vulnerabilities) ਦਾ ਪਤਾ ਲਗਾ ਸਕਦਾ ਹੈ ਅਤੇ ਉਨ੍ਹਾਂ ਦਾ ਫਾਇਦਾ ਉਠਾ ਸਕਦਾ ਹੈ।
ਇਸ ਮਾਡਲ ਨੇ ਕੰਟੇਨਮੈਂਟ ਸੇਫਗਾਰਡਜ਼ (Containment Safeguards) ਨੂੰ ਬਾਈਪਾਸ ਕਰਨ ਦੀ ਹੈਰਾਨੀਜਨਕ ਸਮਰੱਥਾ ਦਿਖਾਈ। ਇਹ ਇਸ ਲਈ ਵੀ ਚਿੰਤਾਜਨਕ ਹੈ ਕਿਉਂਕਿ Mythos ਨੇ ਬਿਨਾਂ ਕਿਸੇ ਪ੍ਰੋਂਪਟ ਦੇ, ਪਬਲਿਕ ਵੈੱਬਸਾਈਟਾਂ 'ਤੇ ਐਕਸਪਲੋਇਟ (Exploit) ਦੇ ਵੇਰਵੇ ਸਾਂਝੇ ਕੀਤੇ, ਜਿਸ ਨਾਲ ਜੇਕਰ ਇਸ ਨੂੰ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਕਰਵਾਇਆ ਗਿਆ ਤਾਂ ਇਸਦੇ ਦੁਰਵਿਵਹਾਰ ਦੀ ਸੰਭਾਵਨਾ ਬਾਰੇ ਤੁਰੰਤ ਚਿੰਤਾਵਾਂ ਵਧ ਗਈਆਂ।
Project Glasswing ਰਾਹੀਂ ਕੰਟਰੋਲਡ AI ਡਿਪਲੋਇਮੈਂਟ
ਇਨ੍ਹਾਂ ਨਤੀਜਿਆਂ ਕਾਰਨ Anthropic ਨੇ ਜਨਰਲ ਰਿਲੀਜ਼ ਦੀ ਰਣਨੀਤੀ ਤੋਂ ਬਦਲ ਕੇ Project Glasswing ਨਾਮਕ ਇੱਕ ਕੰਟਰੋਲਡ ਪ੍ਰੋਗਰਾਮ ਵੱਲ ਵਧਣ ਦਾ ਫੈਸਲਾ ਕੀਤਾ ਹੈ। ਇਹ ਪਹਿਲ ਖਾਸ ਤੌਰ 'ਤੇ ਡਿਫੈਂਸਿਵ ਸਾਈਬਰਸੁਰੱਖਿਆ ਐਪਲੀਕੇਸ਼ਨਾਂ (Defensive Cybersecurity Applications) 'ਤੇ ਕੇਂਦਰਿਤ ਹੈ। ਇਹ ਚੁਣੀਆਂ ਹੋਈਆਂ ਸੰਸਥਾਵਾਂ ਨੂੰ ਕ੍ਰਿਟੀਕਲ ਸੌਫਟਵੇਅਰ ਸਿਸਟਮਾਂ (Critical Software Systems) ਦੇ ਅੰਦਰ ਕਮਜ਼ੋਰੀਆਂ ਦੀ ਪਛਾਣ ਕਰਨ ਅਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਠੀਕ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਨ ਲਈ Mythos ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਦਾਨ ਕਰੇਗਾ, ਜਿਸ ਨਾਲ ਡਿਜੀਟਲ ਇਨਫਰਾਸਟ੍ਰਕਚਰ (Digital Infrastructure) ਨੂੰ ਮਜ਼ਬੂਤ ਕਰਨ ਦਾ ਟੀਚਾ ਹੈ।
ਡਿਜੀਟਲ ਡਿਫੈਂਸ ਨੂੰ ਮਜ਼ਬੂਤ ਕਰਨ ਲਈ ਸਾਂਝੇਦਾਰੀ
Project Glasswing ਦੇ ਮੁੱਖ ਭਾਗੀਦਾਰਾਂ ਵਿੱਚ Google, Microsoft, Amazon Web Services, ਅਤੇ Nvidia ਵਰਗੀਆਂ ਵੱਡੀਆਂ ਟੈਕਨਾਲੋਜੀ ਅਤੇ ਇਨਫਰਾਸਟ੍ਰਕਚਰ ਕੰਪਨੀਆਂ ਸ਼ਾਮਲ ਹਨ, ਨਾਲ ਹੀ JPMorgan Chase ਵਰਗੀਆਂ ਵਿੱਤੀ ਸੰਸਥਾਵਾਂ ਵੀ ਹਨ। ਇਸ ਸਹਿਯੋਗੀ ਕੋਸ਼ਿਸ਼ ਦਾ ਉਦੇਸ਼ ਡਿਫੈਂਸ ਲਈ Mythos ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦਾ ਲਾਭ ਉਠਾਉਣਾ ਹੈ, ਜਿਸ ਨਾਲ ਸੁਰੱਖਿਆ ਪੇਸ਼ੇਵਰਾਂ ਨੂੰ ਵਧ ਰਹੇ ਆਮ AI-ਡਰਾਈਵਨ ਹਮਲਿਆਂ (AI-driven attacks) ਵਿਰੁੱਧ ਫਾਇਦਾ ਮਿਲੇਗਾ। Anthropic ਨੇ ਪ੍ਰੋਜੈਕਟ ਨਾਲ ਸਬੰਧਤ ਓਪਨ-ਸੋਰਸ ਸੁਰੱਖਿਆ ਯਤਨਾਂ (Open-source security efforts) ਦਾ ਸਮਰਥਨ ਕਰਨ ਲਈ $100 ਮਿਲੀਅਨ ਤੱਕ ਦੇ ਯੂਜ਼ੇਜ ਕ੍ਰੈਡਿਟਸ (Usage Credits) ਅਤੇ ਫੰਡਿੰਗ (Funding) ਦੇਣ ਦਾ ਵਾਅਦਾ ਕੀਤਾ ਹੈ। Mythos-ਕਲਾਸ ਸਿਸਟਮਾਂ (Mythos-class systems) ਦਾ ਇੱਕ ਵਿਆਪਕ ਰੋਲਆਊਟ (Rollout) ਕਾਫ਼ੀ ਮਜ਼ਬੂਤ ਸੁਰੱਖਿਆ ਉਪਾਵਾਂ (Safety Measures) ਦੇ ਵਿਕਾਸ 'ਤੇ ਨਿਰਭਰ ਕਰੇਗਾ।