Tooral hulk variautoreid? Uus algoritm eristab vana testamendi kaasautoreid rabava täpsusega

Küll aga on töömahukaks ülesandeks osutunud kõigi eri allikate kaardistamine. Nüüd on uurijad välja töötanud algoritmi, mis võib aidata piibli eri raamatute mitmete allikate saladust lahendada, vahendab PhysOrg.com.
Tel Avivi ülikooli Blavatniki-nimelise informaatikaõppetooli professor Nachum Dershowitz on koos piibliuurijast poja Idan Dershowitziga Heebrea ülikoolist ning professor Moshe Koppeli ja doktorand Navot Akivaga Bar-Ilani ülikoolist leidnud, et nende raalalgoritm suudab tuvastada lingvistilisi juhtlõngu — näiteks sõnavaralisi eelistusi — ja lahterdada nende põhjal tekstid oletatavate autorirühmade vahel.
Teksti sisu ja žanri asemel eranditult kirjutamisstiilile keskendudes õnnestus prof Dershowitzil ja kolleegidel hiilida mööda mitmetest konventsionaalset piibliuuringut kammitsevatest metodoloogilistest takistustest. Sellisteks probleemideks on muu hulgas sisupõhise analüüsi subjektiivsus ning piiblis sisalduvate žanrite ja kirjandusvormide — k.a luule, jutustava laadi, seadusandlike tekstide ja valmide — mitmekesisusest johtuvad komplikatsioonid.
Teadlased esitlesid uuringut arvutuslingvistika liidu ACL USA-s Oregoni osariigis Portlandis toimunud 49. aastakonverentsil.
Prof Dershowitzi osutusel otsib nende arendatud tarkvara selliseid üksikasju, mille tuvastamisega inimestest õpetlased võiksid hätta jääda, nagu „funktsionaalsete“ sõnade ja sünonüümide kasutamise sagedus. Nende üksikasjade mõju teksti enda tähendusele on väike, ent tihti väljendub neis autori või allika isikupärane stiil. Erinevus võib olla sama märkamatu kui konkreetse autori eelistus kasutada sõna „ütles“ asemel sõna „rääkis“ või „lausus“.
Meetodi paikapidavuse kontrollimiseks segasid uurijad kokku juhuslikke lõike vana testamendi Jeremia ja Hesekieli raamatutest ning andsid arvutile ülesande need eristada. Peatükke sünonüümieelistuste alusel sõeludes ja kategoriseerides ning seejärel sagedamini esinevate sõnade kasutust analüüsides suutis arvutiprogramm lõike eristada 99-protsendise täpsusega. Samuti ei valmistanud programmile raskusi toora jaotamine „preestritele mõeldud“ — s.t, eelkõige usuliste kombetalituste korda käsitlevateks — ja „,mittepreesterlikeks“ materjalideks. See on lahterduskriteerium, mida piibliõpetlased sageli rakendavad.
Ehkki uus algoritm pole veel piisavalt edasijõudnud, et öelda täpselt, kui palju autoreid piibli konkreetsete raamatute kirjutamisega seotud oli, väljendas prof Dershowitz lootust, et see aitab tuvastada tekstis üleminekukohti, kus allikas muutub, mis omakorda võiks heita uut valgust mõnedele pikka aega väldanud debattidele.
Jälgi Forte uudiseid ka Twitteris!