DeepMindi agressiivsus ei väljendunud küll selles, et see kellegi peale karjuma oleks hakanud või nõusid lõhkunud, vaid sellest, kuidas see lihtsates arvutimängudes tegutses.

Eelmisel aasta lõpus näidati, et DeepMind on võimeline oma mälust teadmisi ammutades ja järeldusi tehes iseseisvalt õppima ja selle tulemusena maailma parimaid Go (strateegiline lauamäng Hiinast) mängijaid alistama. Seejärel on DeepMind tegelenud selle õppimisega, kuidas veatult inimhäält jäljendada.

Nüüd on teadlased arvutimängudega katsetanud DeepMindi koostöövõimet ja kalduvust teise võistlejaga teravaks vastandumiseks. Nad ütlevad värskelt avaldatud teadusuuringus, et kui DeepMind tunneb, et ta hakkab mängus kaotama, valib see oma „mõistusest“ lähtuvalt väga agressiivsed strateegiad, et igal juhul mängust võitjana välja tulla.

Nende katsete puhul oli kasutuses ülilihtne arvutimäng nimega Gathering (videos), milles kaks DeepMindi „agenti“ (videos sinine ja punane ruut) teineteise vastu õunte (rohelised ruudud) korjamises võistlesid. Seda jooksutati kokku 40 miljonit käiku.
Teadlased leidsid, et kuni õunu oli piisavalt, laabus kõik sujuvalt. Aga niipea, kui õunu nappima hakkas, muutusid mõlemad agendid teineteise vastu agressiivseks ja hakkasid teineteist laserkiirtega tulistama (mängus oli võimalus ka „relv“ haarata, videos väljenduvad need kollaste joontena), et vastane mängust välja lüüa ja kõik õunad endale saada. Mängureeglite järgi ei saa kumbki kahest võistlejast vastast edukalt laserkiirega „tulistades“ selle eest mingit lisatasu või eripreemiat, kuid vastane lüüakse kindlaks perioodiks mängust välja, mis võimaldab teisel sel ajal rohkem õunu korjata.

Kui DeepMindi võistlejad varus olevad laserkiired kasutamata jätaksid, võiksid mõlemad teoreetiliselt võrdse õunte arvuga lõpetada. AI vähem intelligentsed ja lihtsamad versioonid otsustasidki just seda teed minna. Ent siis, kui rakendati tehisintellekti edasijõudnumat, suuremat ja keerukamat versiooni, ilmnesid selle – või tema? – käitumises juba inimlik-vastikud jooned nagu ahnus ja agressioon. Vähe sellest, kui mängus olid koos mitte võrdse võimekusega, vaid nutikam ja juhmim DeepMindi agent, otsustas intelligentsem pool teist igal juhul laserkiirega tulistada olenemata sellest, kui palju õunu parasjagu järel oli.

Teadlased ütlevad, et mida intelligentsem AI agent on, seda rohkem on see võimeline ümbritsevast õppima ja oma järgmisi samme planeerima, sealhulgas kaaluma ja kasutama ka väga agressiivset taktikat, et lõpptulemusena olukorrast võiduga välja tulla.

Teine mäng, mida DeepMind pidi „kolmekesi“ mängima, kandis nime Wolfpack. Selle puhul olid kaks tehisintellekti agenti hundid ja üks saakloom. Erinevalt Gatheringist pidid kaks „hunti“ selles koostööd tegema. Mõlemad said saagile tabamishetkel lähedal olemise eest punkti olenemata sellest, kumb kahest saagi maha võttis. Selle mängu tulemusena õppis AI, et kõrgema isiklikul skoori huvides on koostöö tegemine kasulik.

AI käitumisest võib järeldada, et kui panna erinevad tehisintellektil põhinevad süsteemid reaalses elus omamoodi võistlevaid ülesandeid täitma, võib nende vahel lahinguks minna, kui laiemaks eesmärgiks pole selgelt seatud inimühiskonna hüvang. Mõtleme näiteks konfliktile nutika foorisüsteemi ja isejuhtivate autode vahel – ühe ülesanne on liiklust aeglustada, teisel leida kiireim teekond. Need süsteemid peaksid kindlasti teineteise eesmärke arvesse võtma, et parim teekond luua.


Elon Musk, kes lõi uurimisgrupi OpenAI, mis tegeleb tehisintellektiga seotud eetikaküsimustega, ütles aastal 2015, et kõigil süsteemidel on muljetavaldav, kuid üsna kitsalt piiritletud võimekus. „Näib, et kui me nende piiranguid vähendame, võivad need peaaegu iga intellektuaalse küsimuse lahendamisel inimesega samale tasemele. Raske on öelda, kui palju inimesega võrdselt intelligentne AI ühiskonnale kasu teeks ja kui palju võiks see ühiskonda kahjustada, kui see on valesti ehitatud või seda väärkasutatakse.“