Na letošnji maturi se je med tisočimi dijaki znašel tudi nenavaden kandidat oziroma kandidatka. Ni bil pod stresom, ni se potil pod pritiskom časa in ni prebedel noči ob učenju. Njegov esej pa je bil slovnično brezhiben, struktura jasna in argumenti na prvi pogled urejeni. Kljub temu je ta kandidat – chatgpt – na izpitu iz filozofije pogrnil z oceno 8 od 20, kar bi v slovenskem sistemu pomenilo nezadostno.

To je bil rezultat preprostega  eksperimenta, ki ga je izvedla redakcija francoske televizije France 3. Umetni inteligenci so zastavili eno od uradnih maturnostnih vprašanj: Ali je resnica vedno prepričljiva? Odgovor, ki ga je spisal chatgpt, je bil nato predan v oceno izkušenemu profesorju filozofije, ki ga je obravnaval kot vsak drug dijaški izdelek.

Pisanje brez napak

Na videz je esej izpolnjeval vsa formalna merila. Uvod, jedro s tremi deli in zaključek so bili na svojem mestu. Pisanje je bilo tekoče, brez pravopisnih ali slovničnih napak, kar bi pri marsikaterem dijaku že zadostovalo za pozitivno oceno. Toda filozofija zahteva več kot samo lepo oblikovane stavke — zahteva razmišljanje.

Profesorjeva analiza je bila neizprosna in je razkrila temeljne pomanjkljivosti strojno generiranega razmišljanja. Kljub akademskemu videzu je bil esej vsebinsko prazen, brez prave analize in brez odtenkov, ki ločijo resnično razumevanje od mehanskega ponavljanja.

Neuspeh na tem testu bržkone ni dokaz, da je umetna inteligenca neuporabna, vendar je opozorilo, da je to predvsem orodje in ne nadomestek človeškega uma. 

Prva in ključna napaka, je bila, da je chatgpt subtilno spremenil srčiko  vprašanja. Namesto da bi obravnaval, ali je resnica vedno prepričljiva, je svoj esej usmeril v sorodno, vendar lažje vprašanje: ali resnica zadošča, da bi prepričala. Ta premik je takoj zmanjšal relevantnost celotne argumentacije.

Nizanje logičnih blokov

Profesor je izpostavil tudi preveč očiten in shematičen načrt eseja. Kjer bi moral tekoč prehod med idejami ustvarjati prepričljivo celoto, je umetna inteligenca zgolj nanizala logične bloke. Manjkale so subtilne povezave in organski razvoj misli. Argumenti so ostali na površju, primeri so bili navrženi brez prave umestitve v kontekst, ključni filozofski pojmi, kot je sama resnica, pa niso bili nikoli zares opredeljeni ali problematizirani.

To kaže na ključno omejitev današnjih velikih jezikovnih modelov. Sposobni so oblikovati ideje, vendar jih v resnici ne razumejo. Pri filozofiji pisanje ni dovolj. Treba je dvomiti o pomenu besed, kopati globlje v koncepte in razvijati originalno misel.

Chatgpt in podobna orodja so izjemno zmogljivi stroji za prepoznavanje vzorcev in posnemanje. Učijo se na podlagi ogromnih količin besedil, ki so jih ustvarili ljudje, in so mojstri v sestavljanju verjetnih zaporedij besed. Vendar to seveda ni enako razmišljanju.

Neuspeh na tem testu bržkone ni dokaz, da je umetna inteligenca neuporabna, vendar je opozorilo, da je to predvsem orodje in ne nadomestek človeškega uma. To lahko vpliva predvsem na njeno uporabo v izobraževanju.

Priporočamo