Vendarle presenečenje

Michael Redmond, poklicni igralec goja z doseženim »velemojstrskim« naslovom (v goju je to deveti dan), kot strokovni komentator in Chris Garlock nista mogla prikriti vznemirjenja, ko je Li Se Dol po treh urah in pol prve partije z Googlovo umetno inteligenco alphago začel odlašati z naslednjo potezo. Najboljši igralec goja na svetu v zadnjem desetletju je resda imel na voljo še skoraj pol ure časa, njegov digitalni nasprotnik pa le dobrih pet, toda 33-letni Li je bil v slabem položaju. In po kakšnih petih minutah premisleka je to tudi priznal.

Tako se je zgodilo, česar večina poznavalcev dosežene ravni umetne inteligence in goja, te verjetno najzapletenejše miselne igre na deski z 19 krat 19 točkami, vendarle (še) ni pričakovala. Računalnik je premagal človeka, natančneje, premagala ga je samoučeča se umetna inteligenca. Ko je pred približno letom dni crazystone, verjetno dotlej najnaprednejši program, premagal japonskega velemojstra goja zgolj zaradi dogovorjene prednosti pri odprtju igre, je Rémi Coulom, francoski avtor crazystona, izjavil, da računalnik brez podobne dogovorjene prednosti še deset let ne bo dobil dvoboja z vrhunskim igralcem goja.

Strojno učenje

Po devetnajstih letih, odkar je računalniški program deep blue slavil proti svetovnemu šahovskemu prvaku Gariju Kasparovu, je – vsaj v prvi partiji – računalnik dokazal premoč tudi v goju. Toda razlika je »kakovostna«: medtem ko je v prvem primeru šlo za zmago »surove računalniške moči«, torej hitrost preračunavanja neštetih shranjenih kombinacij, je južnokorejskemu igralcu goja nasproti »sedel« program, ki se je s svojo večplastno umetno nevronsko mrežo sposoben učiti.

In alphago se je, odkar je lani oktobra brez izgubljenega dvoboja premagal aktualnega evropskega prvaka v goju Fana Huja, Kitajca s francoskim potnim listom, nenehno učil. V neprestanih in neštetih igrah proti samemu sebi, proti prejšnjim različicam samega sebe, je dopolnjeval svoje (pre)poznavanje vzorcev in potez, na podlagi česar se je nato naučil novih. Svojo začetno »knjižnico« kakšnih 100.000 vrhunskih partij goja je tako sproti dopolnjeval z lastnimi kombinacijami.

Redmondova sprotna analiza potez v neposrednem prenosu je tako razkrila marsikatero nepričakovano odločitev, ki se je za alphago šele v nadaljevanju izkazala za dobro. Po začetni defenzivi je alphago počasi vzpostavil ravnotežje in po poltretji uri partije nadaljeval vedno bolj napadalneje. Do takrat približno enako porabljeni čas za razmišljanje se je za umetno inteligenco naglo skrajšal, toda glede na izid očitno s pridom, saj je prednost na osvojeni površini začela naraščati. Pristali smo na Luni, je na twitterju zapisal soustanovitelj deepminda Demis Hassabis, ki razvoju umetne inteligence pravi »program Apollo za 21. stoletje«. or