Hiljuti rakendasid Alberta ülikooli informaatikaprofessor ja keeletehnoloogia (ingl natural language processing) spetsialist Greg Kondrak ning magistriõppe tudeng Bradley Hauer tehisintellekti inimkeelele omase mitmetähenduslikkuse analüüsimiseks Voynichi käsikirja näitel.

Uurijate esimeseks ülesandeks oli püüda välja selgitada keelt, milles šifreeritud tekst koos kentsakate illustratsioonidega sadadele habrastele pärgamentlehtedele kirja pandud on.

Keele süstemaatilise tuvastamise aluseks võtsid Kondrak ja Hauer 400 eri keelt, milles on saadaval inimõiguste rahvusvaheline ülddeklaratsioon. Nende esialgse hüpoteesi järgi pidanuks Voynichi käsikiri olema kirjutatud araabia keeles, kuid pärast algoritmtöötlust selgus, et kõige tõenäolisemalt on tekst hoopis heebreakeelne.

„See üllatas meid,“ tunnistas Kondrak. „Pealegi oli nentimine, et tegemist on heebrea keelega, alles esimene samm. Järgmiseks pidime otsustama, kuidas seda dešifreerida.“

Kondrak ja Hauer oletasid, et käsikirja loomisel kasutati nn alfagramme — tähestikuliselt järjestatud anagramme —, mis defineerivad üht fraasi teise kaudu, nagu on omane olemuslikult mitmetähenduslikule inimkeelele. Taolise eelduse toel püüdsid nad leida algoritme, mis võiksid saada hakkama vastavalt segi paisatud teksti lahtimuukimisega.

Appi tõttas Google Translate

„Tuli välja, et rohkem kui 80 protsenti tekstis sisalduvatest sõnadest leiduvad heebrea keele sõnastikus, ent me ei teadnud, kas ja kuidas need koos midagi mõistlikku tähendada võiksid,“ kommenteeris Kondrak.
Kuna teadlastel ei õnnestunud leida vanaheebrea keeles hästi orienteeruvaid õpetlasi, kes nende avastust kinnitanuks, võtsid nad järgmiseks appi veebi-tõlkerakenduse Google Translate.

„Google Translate moodustas grammatiliselt korrektse lause, mida on võimalik tõlkida,“ selgitas Kondrak. „„Too naine jagas soovitusi preestrile, majaperemehele, mulle ja rahvale.“ Käsikirja alustamiseks on see lause mõneti kummaline, kuid kannab täiesti ilmselt selget mõtet.“

Ilma muinasheebrea keele spetsialistide abita peab Voynichi käsikirja täielik sisu esialgu saladuseks jääma, selgitas Kondrak, kes enda kinnitusel loodab peagi Haueriga kahasse loodud algoritme muudegi vanade käsikirjade tähenduse lahtimurdmise juures kasutada.

Mittetehislik keel on arvuteile keeruline

Innuka keelehuvilisena on Kondrak laialt tuntud saavutuste poolest praktilise raallingvistika e keeletehnoloogia vallas. Keeletehnoloogiaks (ingl natural language processing) nimetatakse tehisintellekti-uuringute haru, mis tegeleb arvutitele inimkeele õpetamisega.

„Meie, inimesed, kasutame omavahelises suhtluses inimkeelt, mida raalid ei mõista, sest see keel on loodud kasutamiseks inimestele. Mittetehislikus keeles on väga palju mitmetähenduslikkust, mida me ise enamasti ei märkagi,“ selgitas Kondrak. „Keeletehnoloogia aitab arvutitel inimkeelest aru saada. Arvutitega inimkeeles suhtlemise oleme sihiks võtnud mitte ainult seetõttu, et nii on lihtsam ja mugavam, vaid ka seetõttu, et väga palju informatsiooni eksisteerib ainult kirjasõna kujul — näiteks internetis.“

Uurimus ilmus teadusajakirjas Transactions of the Association for Computational Linguistics, seda saab pikemalt lugeda siit.