Istraživanje dovodi u pitanje sposobnost AI-ja da postavlja dijagnozu

Alati umjetne inteligencije, poput popularnog ChatGPT-a, nisu dobri u postavljanju dijagnoza, zaključilo je istraživanje, čiji su rezultati objavljeni u ponedjeljak, dok se medicinska korist AI-ja pomno ispituje diljem svijeta.

Istraživanje čiji su rezultati objavljeni u časopisu Nature Medicine, provedeno na 1300 ljudi u Ujedinjenom Kraljevstvu, pokazuje da nekoliko modela umjetne inteligencije – ChatGPT, Llama (Meta) ili Command R+ – ne daje bolje rezultate od obične internetske pretrage kada se pacijent pita o svojim simptomima.

“Vlada veliko uzbuđenje zbog modela umjetne inteligencije, ali oni jednostavno nisu spremni zamijeniti liječnika”, istaknula je u priopćenju Rebecca Payne, istraživačica sa Sveučilišta u Oxfordu i suautorica studije.

Sudionici istraživanja nisu bili stvarno bolesni. Sudjelovali su u svojevrsnoj igri uloga: istraživači su im podijelili deset različitih skupova simptoma oko kojih u medicinskoj zajednici postoji konsenzus o pripadajućoj dijagnozi.

Samo je trećini sudionika postavljena točna dijagnoza. To nije ništa bolje nego u skupini koja se morala zadovoljiti klasičnim pretraživanjem interneta.

Ipak, neka su istraživanja pokazala da ChatGPT i drugi modeli mogu uspješno položiti medicinske ispite: postavljeni u ulogu studenta medicine pred, primjerice, pitanjima s višestrukim izborom, sustavi umjetne inteligencije dobro se snalaze.

Međutim, ovo novo istraživanje pokazuje da se situacija mijenja kada je riječ o interakciji sa stvarnim ljudima. Oni, naime, mogu biti nedovoljno precizni u opisu svojih simptoma te ne pružiti sve ključne elemente, navode istraživači.

Ovo je istraživanje dio velikih rasprava o potencijalnom doprinosu umjetne inteligencije u pogledu medicinskih informacija, s obzirom na to da se u mnogim zemljama, uključujući i one razvijene, često mora dugo čekati na pristup liječniku.

U Francuskoj bi se Visoka uprava za zdravstvo (HAS) uskoro trebala očitovati o koristima izravne uporabe AI-ja za pacijente. Krajem 2025. već je procijenila da bi ti alati mogli pomoći zdravstvenim djelatnicima ako se koriste razumno.

Istraživanje objavljeno u ponedjeljak ima određena ograničenja, poput metodologije temeljene na fiktivnim scenarijima. Korišteni modeli su, osim toga, u međuvremenu uvelike zamijenjeni učinkovitijim verzijama.

No “ovo je vrlo važno istraživanje koja naglašava da chatbotovi predstavljaju stvarne medicinske rizike za širu javnost”, ocijenio je za AFP David Shaw, stručnjak za bioetiku sa Sveučilišta u Maastrichtu u Nizozemskoj.