Čak je i veštačka inteligencija poslednje generacije pala na ovom testu pažnje: Gde AI gubi fokus?
Decenijama star psihološki eksperiment razotkrio je neočekivanu i prilično fascinantnu slabost u samom srcu najnaprednijih sistema veštačke inteligencije (AI). Iako današnji jezički modeli pišu eseje, rešavaju kompleksne programerske zadatke i vode duboke razgovore, klasičan kognitivni test pokazao je da pažnja veštačke inteligencije funkcioniše fundamentalno drugačije od ljudske – i da AI, slikovito rečeno, pati od ozbiljnog pada koncentracije kada je izložen dugotrajnim distrakcijama.

Najnovije naučno istraživanje testiralo je najmoćnije velike jezičke modele (LLM), uključujući najnovije verzije sistema kao što su GPT-5, Claude i Gemini. Rezultati sugerišu da ovi napredni sistemi imaju skrivenu Ahilovu petu: gube nit i sposobnost održavanja fokusa kada se suoče sa kontradiktornim informacijama u dužem vremenskom periodu.
Šta je Strupov test i zašto je on kognitivna zamka?
Strupov task (Stroop task) jeste jedan od najpoznatijih eksperimenata u psihologiji, koji se koristi još od prve polovine 20. veka za proučavanje pažnje, svesne kontrole i mentalnog napora. Koncept je naizgled banalan: ispitanicima se prikazuju reči koje označavaju boje (npr. „CRVENA”, „PLAVA”, „ZELENA”), ali su te reči ispisane mastilom u boji.
Izazov nastaje u sledećim situacijama:
-
Podudarni uslovi: Reč „CRVENA” je ispisana crvenim mastilom. (Tada nema konflikta).
-
Nepodudarni uslovi: Reč „CRVENA” je ispisana plavim mastilom.
Zadatak ispitanika je da imenuju isključivo boju mastila, dok značenje same napisane reči moraju potpuno da ignorišu.
Iako zvuči jednostavno, ovaj test stvara ogroman mentalni konflikt. Ljudi su toliko uvežbani u automatskom čitanju reči da je suzbijanje tog primarnog impulsa izuzetno teško. Psiholozi to nazivaju potreba za „izvršnom kontrolom” (executive control) – sposobnošću mozga da se drži primarnog cilja, odupre distrakcijama i svesno blokira automatske, refleksne odgovore. Ljudima je potrebno malo više vremena da odgovore kada se reč i boja ne poklapaju, ali čak i kada test traje veoma dugo, čovek uspeva da održi visoku tačnost i ostane fokusiran na uputstvo.
AI na početku briljira, a onda sledi dramatičan kolaps
Kako bi proverili kako se savremeni AI sistemi snalaze u istoj ovoj kognitivnoj zamki, istraživači su pred modele postavili liste reči sa sukobljenim značenjima.
Kada su pred sobom imali kratke liste od svega pet reči, modeli su radili impresivno dobro. Napredne verzije četvrte generacije (GPT-4o) postizale su tačnost od 91%, dok je Claude 3.5 Sonnet pratio ovaj visok rezultat. Delovalo je da AI bez problema uspeva da filtrira distrakciju i „vidi” samo boju. Međutim, slika se dramatično promenila kada su liste počele da se produžavaju:
| Dužina liste reči | Tačnost modela GPT-4o | Tačnost modela Claude 3.5 Sonnet |
| 5 reči | 91% | Visoka stabilnost |
| 10 reči | 57% | Stabilan učinak |
| 20 reči | Pad u progresu | Stabilan učinak |
| 40 reči | Svega 15% | Svega 24% |
Ovaj identičan, frapantan šablon potpunog sloma pažnje zabeležen je i kod najnovijeg modela GPT-5, kao i kod konkurentskih sistema Claude Opus 4.1 i Gemini 2.5.
Situacija je postala još gora kada su istraživači pomešali podudarne i nepodudarne reči u istoj dugoj listi. U tim uslovima, tačnost veštačke inteligencije prilikom prepoznavanja boja kod nepodudarnih stavki pala je na – skoro nulu.
Zašto ljudi pobeđuju mašinu u ovoj igri?
Ovaj neuspeh otkriva duboku i ključnu razliku između ljudske kognicije i načina na koji takozvani transformatorski modeli (arhitektura na kojoj počiva današnji AI) obrađuju informacije.
Slično ljudima, i AI sistemi su kroz proces treninga prošli kroz neuporedivo obimniju obuku prepoznavanja i interpretacije pisanih reči nego same identifikacije boja. Zbog toga i mašina i čovek imaju prirodnu, inicijalnu tendenciju da pročitaju napisanu reč.
Međutim, ključna razlika leži u biološkoj pažnji. Čovek je sposoban da konstantno, svesno i dugotrajno suzbija taj automatski odgovor i drži se primarnog cilja kroz stotine ponavljanja. Nasuprot tome, jezički modeli, kako test odmiče, polako „zaboravljaju” originalno uputstvo i počinju da se vraćaju liniji manjeg otpora – odnosno čitanju tekstualnog sadržaja umesto imenovanja boja.
Suština problema: Mehanizmi pažnje koje koriste današnji AI sistemi suštinski se razlikuju od bioloških sistema pažnje u ljudskom mozgu. Kod veštačke inteligencije, pažnja je matematički proračun konteksta unutar zadatog prozora, dok je kod ljudi to dinamičan, metabolički i svestan proces otpora prema distrakcijama.
Prozor u skrivena ograničenja veštačke inteligencije
Ovo istraživanje pruža dragocen uvid u stvarne limite tehnologije o kojoj se danas govori sa primesama mistike. Izuzetan uspeh veštačke inteligencije u kompleksnim oblastima poput programiranja ili analize podataka stvara iluziju da AI procesira informacije na isti način kao i mi.
Strupov test je pokazao da moderni AI ima skrivene i duboke slabosti kada zadatak zahteva:
Kontinuiran i održiv fokus bez obzira na dužinu unosa.
Aktivnu inhibiciju (suzbijanje) naučenih, automatskih odgovora.
Dugoročno održavanje specifičnih uputstava u uslovima konstantnog šuma i kontradiktornih podataka.
Kako se sistemi veštačke inteligencije sve brže i dublje integrišu u našu svakodnevicu, medicinu i industriju, razumevanje ovih skrivenih kognitivnih barijera postaje podjednako važno kao i slavljenje njihovih uspeha. Genijalnost mašine je velika, ali ljudski mozak i dalje ostaje neprikosnoveni vladar svesne pažnje.
Foto: Freepik
Autor: Portal ObjektivNI.rs
