Vijesti

Od naučne fantastike do stvarnosti: Kako poplava dezinformacija pretvara internet u beskorisnu gomilu podataka

Autor Dušan Volaš

Da li će internet u narednim decenijama postati beskonačna i beskorisna biblioteka?

Izvor: Shutterstock

U svom romanu Jesen iz 2019. godine, pisac naučne fantastike Nil Stivenson zamislio je blisku budućnost u kojoj internet još uvijek postoji. Ali postao je toliko zagađena pogrešnim informacijama, dezinformacijama i reklamama da je u velikoj mjeri neupotrebljiv.

Likovi u Stivensonovom romanu ovaj problem rješavaju tako što se pretplate na „uredničke strimove“ – vijesti i informacije koje je izabrao čovjek i koje se mogu smatrati pouzdanim. Problem je u tome što samo bogati sebi mogu da priušte takve usluge, ostavljajući većinu čovječanstva da konzumira nekvalitetan, neprovjeren onlajn sadržaj.

U izvjesnoj mjeri, ovo se već dogodilo, smatra Rodžer Kruz, profesor psihologije na Univerzitetu u Memfisu. Mnoge novinske kuće, kao što su Njujork tajms i Vol Strit džurnal, naplaćuju čitanje svog onlajn sadržaja. U međuvremenu, dezinformacije se šire na platformama društvenih medija kao što su Iks i Tik-tok.

Stivenson se istakao kao prognostičar u više navrata – predvidio je nastanak metaverzuma u svom romanu Lavina iz 1992. godina, a ključni element zapleta njegovog Dijamantskog doba (1995) je interaktivni početnik koji funkcioniše slično kao čet-bot.

Na prvi pogled, čini se da čet-botovi nude rješenje u borbi protiv epidemije dezinformacija. Objavljivanjem činjeničnog sadržaja, čet-botovi bi mogli da obezbijede alternativne izvore visokokvalitetnih informacija koje ne moraju da se plate.

Ironično, međutim, rezultati ovih čet-botova mogu predstavljati najveću opasnost za budućnost veba – onu koju je decenijama ranije nagovestio argentinski pisac Horhe Luis Borhes.

Uspon čet-botova

Danas se značajan dio interneta još uvijek sastoji od činjenično utemeljenog i naizgled istinitog sadržaja, kao što su članci i knjige koji su recenzirani, zasnovani na činjenicama ili na neki način provjereni.

Programeri velikih jezičkih modela, ili LLM-ova (large language models) – mehanizama koji pokreću botove kao što su ChatGPT, Kopilot i Džemini – iskoristili su ovaj resurs.

Međutim, da bi ispunili svoju magiju, u ove modele moraju da se unesu ogromne količine visokokvalitetnog teksta za potrebe obuke. Ogromna količina materijala je već preuzeta iz onlajn izvora i dostavljena novim LLM-ovima.

Problem je u tome što je veb, koliko god bio ogroman, ograničen resurs. Visokokvalitetni tekstovi koji već nisisu preuzeti postaju sve veća rijetkost, što vodi ka onome što je Njujork tajms nazvao „početkom krize sadržaja”.

Izvor: Pixabay

Ovo je primoralo kompanije kao što je „OpenAI“ da sklope sporazume sa izdavačima kako bi nabavili još više sirovog materijala za svoje nezasite botove. Ali prema jednom predviđanju, nedostatak dodatnih visokokvalitetnih podataka za obuku mogao bi da nastupi već 2026.godine.

Kako rezultati koje proizvode čet-botovi završavaju na mreži, ovi tekstovi druge generacije – zajedno sa izmišljenim informacijama zvanim „halucinacije“, kao i očigledne greške, kao što su prijedlozi da stavite lijepak na vašu picu – dodatno će zagaditi veb.

A ako se čet-bot druži sa pogrešnom vrstom ljudi na mreži, može pokupiti njihove neprihvatljive stavove. „Majkrosoft“ je ovo otkrio na teži način 2016. godine, kada je morao da isključi Teja, bota koji je počeo da ponavlja rasistički i seksistički sadržaj.

Vremenom bi svi ovi problemi mogli učiniti onlajn sadržaj još manje pouzdanim i manje korisnim nego što je danas. Pored toga, LLM koji se „pune hranom sa niskim sadržajem kalorija“ mogu proizvesti još problematičnije rezultate koji takođe završavaju na vebu.

Beskonačna – i beskorisna – biblioteka

Nije teško zamisliti povratnu spregu koja rezultira kontinuiranim procesom degradacije dok se botovi hrane sopstvenim nesavršenim rezultatima.

Rad iz jula 2024. objavljen u časopisu Nejčer istraživao je posljedice obuke modela vještačke inteligencije na rekurzivno generisane podatke. Pokazalo se da „nepovratni defekti“ mogu dovesti do „kolapsa modela“ za sisteme koji su obučeni na ovaj način – slično kao što će kopija slike i kopija te kopije, i kopija te kopije izgubiti vjernost originalne slike.

Koliko loše ovo može da bude?

Borhesova kratka priča Vavilonska biblioteka iz 1941, pedeset godina prije nego što je kompjuterski naučnik Tim Berners-Li stvorio arhitekturu za veb, donosi analogni ekvivalent.

U svojoj priči od 3.000 reči, Horhe Luis Borhes zamišlja svijet koji se sastoji od ogromnog i vjerovatno beskonačnog broja heksagonalnih soba. Police za knjige u svakoj prostoriji sadrže ujednačene tomove koji moraju, prema intuiciji njenih stanovnika, da sadrže svaku moguću permutaciju slova u azbuci.

U početku, ovo shvatanje izaziva radost: po definiciji, moraju postojati knjige koje detaljno opisuju budućnost čovječanstva i smisao života.

Stanovnici tragaju za takvim knjigama, da bi otkrili da ogromna većina ne sadrži ništa osim besmislenih kombinacija slova. Istina je tamo – ali i svaka zamisliva laž. I sve to je ugrađeno u nezamislivo ogromnu količinu besmislica.

Izvor: Envato

Čak i poslije vijekova traženja, pronađeno je samo nekoliko značajnih fragmenata. Čak i tada, ne postoji način da se utvrdi da li su ovi koherentni tekstovi istina ili laž. Nada se pretvara u očaj.

Hoće li internet postati toliko zagađen da samo bogati mogu priuštiti tačne i pouzdane informacije? Ili će beskonačan broj čet-botova proizvesti toliko zagađenih riječi da pronalaženje tačnih informacija na mreži postaje kao traženje igle u plastu sijena?

Internet se često opisuje kao jedno od najvećih dostignuća čovječanstva. Ali kao i svaki drugi resurs, važno je ozbiljno razmisliti o tome kako se održava i kako se njime upravlja – da se ne bismo suočili sa distopijskom vizijom koju je zamislio Borhes.

(RTS/theconversation.com)