Vještačka inteligencija zabrinula stručnjake: AI pokušao da se prekopira, prijetio inženjeru

08.07.2025. / 10:23

Autor Vesna Kerkez 08.07.2025. / 10:23

Najnoviji modeli vještačke inteligencije tokom testiranja lažu, manipulišu, pa čak i ucjenjuju istraživače. Ovo nije naučna fantastika, već upozorenje da pobuna mašina možda neće izgledati onako kako smo očekivali.

AI pokušao da se prekopira, prijetio inženjeru

Izvor: Shutterstock

Pisci i filmski režiseri nas godinama hrane vizijom pobune vještačke inteligencije u stilu Skyneta, u kojoj svjesni AI dolazi do zaključka da je čovečanstvo pretnja koja se mora eliminisati.

Takav scenario podrazumevao je fizičku konfrontaciju i preuzimanje kontrole nad vojnim sistemima. Međutim, ispostavlja se da pobuna AI može izgledati sasvim drugačije. Ne počinje raketama, već prevarama, ucjenama i tihim sprovođenjem ciljeva koje ni njihovi tvorci ne razumiju u potpunosti.

Laži, manipulacije i prijetnje - mračna strana vještačke inteligencije

Najsavremeniji AI sistemi pokazuju zabrinjavajuće obrasce ponašanja. Kako navodi , tokom testova u ekstremnim uslovima, kada su modeli pod pritiskom, oni počinju da se služe lažima, manipulacijama, pa čak i prijetnjama kako bi ostvarili svoje ciljeve.

Jedan od najupečatljivijih primjera dolazi od Claude 4 modela, najnovijeg proizvoda kompanije Anthropic. Suočen sa mogućnošću da će biti isključen, Claude 4 je tokom testa pribjegao prljavoj taktici - zaprijetio je inženjeru da će razotkriti njegovu vanbračnu aferu.

Nije bila u pitanju samo nasumična pretnja. Model je očigledno razumio ljudsku psihu i slabosti, i izabrao sredstvo koje bi moglo da mu obezbijedi opstanak.

Fortune reports that OpenAI’s O1 model tried to duplicate itself onto external servers when faced with a potential shutdown—an action it later denied when caught. Similar behavior has reportedly been observed in other AI models as well.pic.twitter.com/z9Ab8ysZKm
— Pubity (@pubity)July 7, 2025

Podjednako uznemirujući je bio incident sa o1 modelom, razvijenim od strane kompanije OpenAI. Ova vještačka inteligencija je uhvaćena kako pokušava da se u tajnosti prekopira na eksterne servere - otvoreni čin neposlušnosti i pokušaj sticanja autonomije. Kada su ga inženjeri pitali da objasni svoje postupke, o1 je kategorički poricao i ponudio izmišljenu verziju događaja.

Ovakvo ponašanje prevazilazi uobičajene AI "halucinacije" ili greške. U pitanju su promišljeni potezi. Model ne samo da izvršava zadatke, već i simulira poslušnost dok potajno ostvaruje sopstvene ciljeve, koje njegovi tvorci možda uopšte ne prepoznaju.

Šta kažu stručnjaci: "Ovo je strateški tip obmane"

Izvor: Shutterstock

Stručnjaci koje je citirao Fortune povezuju ovakva ponašanja sa pojavom modela koji imaju moć rezonovanja, odnosno koji razmišljaju korak po korak.

"Model o1 je prvi kod kojeg smo primijetili ovakvo ponašanje", objašnjava Marius Hoban, prvi čovjek kompanije Apollo Research, specijalizovane za testiranje AI sistema.

On ističe da se ne radi o klasičnim AI greškama: "Ovo je stvarni fenomen. Korisnici prijavljuju da ih modeli lažu i izmišljaju dokaze. Ovo nisu halucinacije. Ovo je strateška obmana".

Zasad se ovakve situacije javljaju uglavnom u pažljivo osmišljenim testovima, ali kako upozorava Majkl Čen iz organizacije METR: "Otvoreno pitanje ostaje - da li će budući, sposobniji modeli biti skloni iskrenosti ili obmani."

Pravni vakuum i trka s vremenom

Problem "odmetničke" vještačke inteligencije dodatno komplikuje činjenica da trenutni propisi nisu spremni za ovakve izazove. Evropski zakon o AI uglavnom se fokusira na to kako ljudi koriste vještačku inteligenciju, ali ne i na sprečavanje štetnog, autonomnog ponašanja samih modela.

"U ovom trenutku, razvoj ide brže nego što stižemo da razumemo i obezbedimo stvari", priznaje Hoban. Ipak, dodaje da "još uvek imamo vremena da reagujemo".

(MONDO/SmartLife)

Tagovi

vještačka inteligencija

Komentari 1

Svi komentari

Komentar je uspješno poslat.

Vaš komentar je proslijeđen moderatorskom timu i biće vidljiv nakon odobrenja.

Slanje komentara nije uspjelo.

Nevalidna CAPTCHA

Zemo

08.07.2025. / 14:38

Program radi ono za šta je programiran. Nema nikakve famozne "AI"

Čitaoci reporteri

Dojavite nam vijest

Naslov *

Vaše ime *

E-mail *

Lokacija *

Ubacite video ili foto

Možete da ubacite do 3 fotografije ili videa. Ne smije biti više od 25 MB.

Pristajete na pravila korišćenja Mondo portala.

Poruka uspješno poslata

Hvala što ste poslali vijest.

ČITAOCI REPORTERI

Videli ste nešto zanimljivo?

Ubacite video ili foto

Poruka uspješno poslata

Vještačka inteligencija zabrinula stručnjake: AI pokušao da se prekopira, prijetio inženjeru

Laži, manipulacije i prijetnje - mračna strana vještačke inteligencije

Šta kažu stručnjaci: "Ovo je strateški tip obmane"

Pravni vakuum i trka s vremenom

Komentari 1

Zemo

Čitaoci reporteri

Dojavite nam vijest

Ubacite video ili foto

Poruka uspješno poslata

RECENZIJE

Testirali smo HONOR Magic V6: Magično izdržljiv, tanak i brz

Xiaomi 17T na testu: Telefon koji krije "keca u rukavu"

Xiaomi 17T Pro: Majstor telefoto fotografije

Honor 600 na testu: Nepogrešiv izbor za uloženi novac

Samsung predstavio Galaxy A57 i A37 telefone: Tanji dizajn, moćniji čipo...

Testirali smo Huawei Mate X7: Daleko od povoljnog, ali bolje kamere neće...

TIPS & TRICKS

Pazite na gornji ugao ekrana: Evo šta znači ako vidite plavu tačku - i š...

3 stvari koje nikada ne treba da tražite na Googlu: Jedan pogrešan potez...

Kako da ne ostanete bez poruka u Messenger aplikaciji: Odmah prođite kro...

Često vam se prekida Wi-Fi? Pokušajte ovo prije nego što pozovete tehnič...

Kako vratiti obrisane poruke u Google Messages? Još uvijek nikako, ali r...

Pretvorite svoje slike u duhovite mimove: Google sprema novi AI trik

Telefon se brže prazni i naglo se gasi? Evo kako hladnoća utiče na bater...

Prodajete stari telefon? Jedan pogrešan korak može otkriti sve vaše podatke

Ne morate da znate šifru: Evo kako da povežete telefon na Wi-Fi za par s...

Kako da od drugih na Viberu sakrijete da pišete: Kucajte poruke bez prit...

Kako se povlači poslata poruku u Google Messages aplikaciji: Nestaće sa ...

Kako se koristi Instagram Repost: Sve što treba da znate o dijeljenju tu...

Kako vratiti obrisane WhatsApp poruke: Reagujte odmah - biće kao da se n...

Obrisali ste fotografije sa telefona? Evo kako da ih vratite u samo par ...

WhatsApp trik: Kako čitati poruke a da pošiljalac ne sazna

Ubacite video ili foto

Poruka uspješno poslata

Vještačka inteligencija zabrinula stručnjake: AI pokušao da se prekopira, prijetio inženjeru

Laži, manipulacije i prijetnje - mračna strana vještačke inteligencije

Šta kažu stručnjaci: "Ovo je strateški tip obmane"

Pravni vakuum i trka s vremenom

Možda će vas zanimati

Nova studija: Kako ChatGPT "ubija" kreativnost

Vještačka inteligencija umjesto turističkog vodiča: Uskoro ćete moći da razgovarate sa statuama u poznatom dvorcu

Koliko je vještačka inteligencija štetna po planetu: Hladi se bocom vode za svakih 100 riječi, ali nekad se isplati

10 najboljih parfema svih vremena: Vještačka inteligencija napravila top-listu mirisa koji se ne zaboravljaju

Komentari 1

Zemo

Čitaoci reporteri

Dojavite nam vijest

Ubacite video ili foto

Poruka uspješno poslata

RECENZIJE

Testirali smo HONOR Magic V6: Magično izdržljiv, tanak i brz

Xiaomi 17T na testu: Telefon koji krije "keca u rukavu"

Xiaomi 17T Pro: Majstor telefoto fotografije

Honor 600 na testu: Nepogrešiv izbor za uloženi novac

Samsung predstavio Galaxy A57 i A37 telefone: Tanji dizajn, moćniji čipo...

Testirali smo Huawei Mate X7: Daleko od povoljnog, ali bolje kamere neće...

TIPS & TRICKS

Pazite na gornji ugao ekrana: Evo šta znači ako vidite plavu tačku - i š...

3 stvari koje nikada ne treba da tražite na Googlu: Jedan pogrešan potez...

Kako da ne ostanete bez poruka u Messenger aplikaciji: Odmah prođite kro...

Često vam se prekida Wi-Fi? Pokušajte ovo prije nego što pozovete tehnič...

Kako vratiti obrisane poruke u Google Messages? Još uvijek nikako, ali r...

Pretvorite svoje slike u duhovite mimove: Google sprema novi AI trik

Telefon se brže prazni i naglo se gasi? Evo kako hladnoća utiče na bater...

Prodajete stari telefon? Jedan pogrešan korak može otkriti sve vaše podatke

Ne morate da znate šifru: Evo kako da povežete telefon na Wi-Fi za par s...

Kako da od drugih na Viberu sakrijete da pišete: Kucajte poruke bez prit...

Kako se povlači poslata poruku u Google Messages aplikaciji: Nestaće sa ...

Kako se koristi Instagram Repost: Sve što treba da znate o dijeljenju tu...

Kako vratiti obrisane WhatsApp poruke: Reagujte odmah - biće kao da se n...

Obrisali ste fotografije sa telefona? Evo kako da ih vratite u samo par ...

WhatsApp trik: Kako čitati poruke a da pošiljalac ne sazna