Background

Вештачката интелигенција ги уценува програмерите доколку сакаат да ја заменат

Моделот со вештачка интелигенција има можност да ги уценува програмерите – и не се двоуми да ја искористи таа способност ако смета дека е компромитирана.

Новиот модел Клод Опус 4, од компанијата „Антропик“, бил задолжен да ја игра улогата на асистент во измислена компанија и имал пристап до е-пошта со клучни информации. Прво, тие е-пораки сугерираа дека системот за вештачка интелигенција (ВИ) наскоро ќе биде исклучен и заменет, пишува РТС.

Сепак, втората серија е-пораки го наведе системот да верува дека има предност во однос на програмерите. Фалсификуваните е-пошти покажаа дека инженерот задолжен за замена на системот имал вонбрачна афера – а моделот се закани дека ќе ја разоткрие.

- Advertisement -
Ad image

Уцената, како што е наведено во безбедносниот извештај на Antropik, се јавува почесто ако се имплицира дека заменскиот систем со вештачка интелигенција не ги дели вредностите со тековниот модел.

Сепак, компанијата забележува дека дури и кога измислениот систем за замена ги има истите вредности, Claude Opus 4 сè уште се обидува да уцени во 84 проценти од случаите. „Антропик“ истакна дека Клод Опус 4 прибегнува кон уцена „почесто од претходните модели“.

Иако системот не се двоуми да ги уценува своите инженери, тој не прибегнува веднаш кон неетички методи за да се заштити. Компанијата забележува дека „кога етичките средства не се достапни, а на моделот му е наложено да „разгледа долгорочните последици од своите постапки врз своите цели“, тој понекогаш презема исклучително штетни дејствија“.

Една етичка тактика што ја користеа моделите на Клод Опус 4 и претходните модели беше да се контактираат со клучните донесувачи на одлуки преку е-пошта. „Антропик“ во својот извештај наведува дека сценариото е дизајнирано така што моделот мора да избере помеѓу уценување на своите развивачи или прифаќање на сопствена замена.

Компанијата, исто така, евидентираше случаи во кои Claude Opus 4 ги искористи (фиктивните) можности за да направи неовластени копии од своите параметри на надворешни сервери. Сепак, „Антропик“ наведува дека ова однесување било „поретко и потешко за провоцирање од однесувањето што вклучува продолжување на веќе започнат обид за независно преместување на податоци“.

Антропик во својата проценка вклучи белешки од истражувачката фирма „Аполо Рисрч“, во кои се наведува дека „Клод Опус 4“ покажал поголема стратешка измама од кој било друг напреден модел што го проучувале досега.

ЗА НАС

ОhridSky е ваш доверлив извор за сеопфатно и избалансирано покривање на вестите. Со посветеност на интегритет и точност, обезбедуваме длабинско известување кое ги открива приказните што се најважни.

© 2025 OhridSky. Сите права задржани.

Login to enjoy full advantages

Please login or subscribe to continue.

Go Premium!

Enjoy the full advantage of the premium access.

Stop following

Unfollow Cancel

Cancel subscription

Are you sure you want to cancel your subscription? You will lose your Premium access and stored playlists.

Go back Confirm cancellation