Вештачката интелигенција ги уценува програмерите доколку сакаат да ја заменат

Моделот со вештачка интелигенција има можност да ги уценува програмерите – и не се двоуми да ја искористи таа способност ако смета дека е компромитирана.

Новиот модел Клод Опус 4, од компанијата „Антропик“, бил задолжен да ја игра улогата на асистент во измислена компанија и имал пристап до е-пошта со клучни информации. Прво, тие е-пораки сугерираа дека системот за вештачка интелигенција (ВИ) наскоро ќе биде исклучен и заменет, пишува РТС.

Сепак, втората серија е-пораки го наведе системот да верува дека има предност во однос на програмерите. Фалсификуваните е-пошти покажаа дека инженерот задолжен за замена на системот имал вонбрачна афера – а моделот се закани дека ќе ја разоткрие.

- Advertisement -

Уцената, како што е наведено во безбедносниот извештај на Antropik, се јавува почесто ако се имплицира дека заменскиот систем со вештачка интелигенција не ги дели вредностите со тековниот модел.

Сепак, компанијата забележува дека дури и кога измислениот систем за замена ги има истите вредности, Claude Opus 4 сè уште се обидува да уцени во 84 проценти од случаите. „Антропик“ истакна дека Клод Опус 4 прибегнува кон уцена „почесто од претходните модели“.

Иако системот не се двоуми да ги уценува своите инженери, тој не прибегнува веднаш кон неетички методи за да се заштити. Компанијата забележува дека „кога етичките средства не се достапни, а на моделот му е наложено да „разгледа долгорочните последици од своите постапки врз своите цели“, тој понекогаш презема исклучително штетни дејствија“.

Една етичка тактика што ја користеа моделите на Клод Опус 4 и претходните модели беше да се контактираат со клучните донесувачи на одлуки преку е-пошта. „Антропик“ во својот извештај наведува дека сценариото е дизајнирано така што моделот мора да избере помеѓу уценување на своите развивачи или прифаќање на сопствена замена.

Компанијата, исто така, евидентираше случаи во кои Claude Opus 4 ги искористи (фиктивните) можности за да направи неовластени копии од своите параметри на надворешни сервери. Сепак, „Антропик“ наведува дека ова однесување било „поретко и потешко за провоцирање од однесувањето што вклучува продолжување на веќе започнат обид за независно преместување на податоци“.

Антропик во својата проценка вклучи белешки од истражувачката фирма „Аполо Рисрч“, во кои се наведува дека „Клод Опус 4“ покажал поголема стратешка измама од кој било друг напреден модел што го проучувале досега.

Вештачката интелигенција ги уценува програмерите доколку сакаат да ја заменат

Previous

Директорот на новоформираната хуманитарна фондација за Газа поднесе оставка

Next

Астрономите се збунети од совршена сфера во длабочините на вселената што емитува радио бранови

Latest news

ЗА НАС

Links

Вештачката интелигенција ги уценува програмерите доколку сакаат да ја заменат

Previous

Директорот на новоформираната хуманитарна фондација за Газа поднесе оставка

Next

Астрономите се збунети од совршена сфера во длабочините на вселената што емитува радио бранови

Latest news

Tags

ЗА НАС

Links

Login to enjoy full advantages

Go Premium!

Enjoy the full advantage of the premium access.

Stop following

Cancel subscription