Da znajo biti klasičnim iskalnikom šteti dnevi, je bila ena prvih napovedi po pojavu prepričljivih velikih jezikovnih modelov umetne inteligence (UI), kot je chatGPT. Praksa je nato pokazala, da je pot do tja lahko še kar dolga. Zlasti zaradi tendence po izmišljevanju odgovorov. Te in podobne težave razvijalci modelov sicer odpravljajo, so pa raziskave pokazale nove razlike med rezultati klasičnih iskalnikov in iskalnikov z UI. Slednji v odgovorih pogosto navajajo manj priljubljene vire oziroma spletne strani. Takšne, ki jih pri običajnem iskanju z googlom sploh ne bi našli med sto najbolj relevantnimi povezavami.

Tako pravijo raziskovalci z Univerze Ruhr v Bochumu v Nemčiji in Inštituta Maxa Plancka za sisteme programske opreme. Primerjali so rezultate običajnega iskanja z googlom in povzetke, s katerimi je na ista poizvedovanja odgovoril Googlov model UI gemini-2.5-flash. Hkrati so preučili način spletnega iskanja GPT-4o in ločeno orodje GPT-4o za iskanje, ki se aktivira, ko veliki jezikovni model identificira pomanjkanje relevantnih podatkov v svojem znanju in odgovore išče na spletu.

Med testiranjem so raziskovalci poizvedbe izbirali iz širokega nabora tematik. Ugotovili so, da se viri, iz katerih so odgovore črpali iskalniki z UI, pogosteje niso uvrstili niti med tisoč ali celo milijon spletišč, ki so najbolj priljubljena pri spletnem iskanju na googlu.

Še posebej naj bi bil k črpanju iz nepriljubljenih virov nagnjen Googlov lasten model gemini. Mediana virov v njegovih iskanjih ni sodila med tisoč najbolj priljubljenih spletišč po podatkih portala Tranco, ki za raziskovalne namene meri priljubljenost spletišča.

Zanimivo je tudi, da se kar 53 odstotkov virov, ki jih je navajala storitev UI-povzetki (to trenutno vidimo na vrhu strani iskalnika google, ko dobimo odgovor na vprašanje), ne bi pojavilo med desetimi najbolj izpostavljenimi googlovimi povezavami. Kar 40 odstotkov virov odgovorov pa se ne bi uvrstilo med »najprimernejših« sto povezav.

Raziskovalci so ugotovili, da se mnogi viri odgovorov Googlove umetne inteligence niso uvrstili niti med milijon najbolj priljubljenih spletišč.

Zakaj prihaja do razlik?

Odgovorov, zakaj so razlike tako velike, je lahko več. Začne se že z različnimi koncepti iskanja. Klasični iskalniki razvrščajo spletne strani glede na relevantnost oziroma avtoriteto spletišča in jih ponudijo uporabniku, da si tam sam poišče odgovor na vprašanje. So kot knjižničarji, ki te pravilno usmerijo.

Iskalniki z UI so medtem namenjeni dajanju konkretnih odgovorov. So kot vsevedi mojstri, ki ti dajo že pripravljen odgovor. Ta naj bi bil celovit, smiseln in (po oceni UI) tudi pravilen. To pa nas pripelje do vprašanja zaupanja, kdo je tisti, ki daje resnične oziroma pravilne odgovore, da jih lahko umetna inteligenca v dobri veri preplonka.

Pred časom se je v javnosti pojavil Googlov dokument, ki je razkril, kako je podjetje po izbruhu covida in širjenju dezinformacij močno pretreslo način razvrščanja spletnih strani v svojih rezultatih. Podjetje je ob razkritju zatrdilo, da je vsebina dokumenta zastarela, a obstajajo sumi, da kakšna stvar še vedno drži. Med drugim je bilo iz dokumenta razvidno, da podjetje bolj kot optimizaciji besedil za pojavljanje v rezultatih iskanja (SEO) zaupa slovesu, prepoznavnosti oziroma obisku spletne strani. Pogosto obiskana ter prepoznavna spletišča, ki uživajo ugled v realnem svetu, naj bi bila zato prednostno razvrščena tudi med iskanji na googlu. To pomeni, da je sloves v javnosti pri googlu morda bolj pomemben kot kakovost vsebine.

UI močno zaupa sporočilom za javnost

Po drugi strani so raziskovalci ugotovili, da so iskalniki z UI pogosteje verjeli enciklopedijam, kar večinoma ni sporno. Bolj vprašljivo pa je, da so ob tem veliko težo dajali tudi vsebinam, ki so jih objavile korporacije. Piarovska sporočila kot vir resnice, torej. Je pa pohvalno, da umetna inteligenca praktično nikoli ni navajala vsebin na družbenih omrežjih.

Raziskovalci so načeloma ugotovili, da je iskanje, podprto z umetno inteligenco, običajno ponujalo podobno raven podrobnosti, raznolikosti in novosti v rezultatih. So pa ugotovili, da UI-iskalniki radi zgostijo informacije in včasih zamolčijo dvoumne vidike, ki jih tradicionalno iskanje ohranja.

Raziskovalci se sicer niso spustili v ocenjevanje, katera oblika iskanja je boljša. So pa izpostavili nekaj bolj pomembnega. Menijo, da bi dognanja morala spodbuditi prihodnje raziskave o metodah vrednotenja virov. Glede na to, da gre za izdelke podjetij z interesom po dobičkih, bi morali biti na to enako pozorni kot na tendenco umetne inteligence, da si izmišljuje podatke. Pomembno bo namreč najti način za preverjanje, kdaj iskalniki z umetno inteligenco ponudijo odgovore, ki so v korist njegovih lastnikov. Naj bo to prek oglaševalskih pogodb, v finančno korist povezanih podjetij ali pa v politično korist naklonjenih politikov. 

Priporočamo