Вештачката интелигенција ги уценува програмерите доколку сакаат да ја заменат

Lorita
By Lorita 3 Min Read
Disclosure: This website may contain affiliate links, which means I may earn a commission if you click on the link and make a purchase. I only recommend products or services that I personally use and believe will add value to my readers. Your support is appreciated!
- Advertisement -
Ad image

Моделот со вештачка интелигенција има можност да ги уценува програмерите – и не се двоуми да ја искористи таа способност ако смета дека е компромитирана.

Новиот модел Клод Опус 4, од компанијата „Антропик“, бил задолжен да ја игра улогата на асистент во измислена компанија и имал пристап до е-пошта со клучни информации. Прво, тие е-пораки сугерираа дека системот за вештачка интелигенција (ВИ) наскоро ќе биде исклучен и заменет, пишува РТС.

Сепак, втората серија е-пораки го наведе системот да верува дека има предност во однос на програмерите. Фалсификуваните е-пошти покажаа дека инженерот задолжен за замена на системот имал вонбрачна афера – а моделот се закани дека ќе ја разоткрие.

Уцената, како што е наведено во безбедносниот извештај на Antropik, се јавува почесто ако се имплицира дека заменскиот систем со вештачка интелигенција не ги дели вредностите со тековниот модел.

Сепак, компанијата забележува дека дури и кога измислениот систем за замена ги има истите вредности, Claude Opus 4 сè уште се обидува да уцени во 84 проценти од случаите. „Антропик“ истакна дека Клод Опус 4 прибегнува кон уцена „почесто од претходните модели“.

Иако системот не се двоуми да ги уценува своите инженери, тој не прибегнува веднаш кон неетички методи за да се заштити. Компанијата забележува дека „кога етичките средства не се достапни, а на моделот му е наложено да „разгледа долгорочните последици од своите постапки врз своите цели“, тој понекогаш презема исклучително штетни дејствија“.

Една етичка тактика што ја користеа моделите на Клод Опус 4 и претходните модели беше да се контактираат со клучните донесувачи на одлуки преку е-пошта. „Антропик“ во својот извештај наведува дека сценариото е дизајнирано така што моделот мора да избере помеѓу уценување на своите развивачи или прифаќање на сопствена замена.

Компанијата, исто така, евидентираше случаи во кои Claude Opus 4 ги искористи (фиктивните) можности за да направи неовластени копии од своите параметри на надворешни сервери. Сепак, „Антропик“ наведува дека ова однесување било „поретко и потешко за провоцирање од однесувањето што вклучува продолжување на веќе започнат обид за независно преместување на податоци“.

Антропик во својата проценка вклучи белешки од истражувачката фирма „Аполо Рисрч“, во кои се наведува дека „Клод Опус 4“ покажал поголема стратешка измама од кој било друг напреден модел што го проучувале досега.

- Advertisement -
Ad image
Share This Article