Celine Dioni hitt, Orwelli "1984" ja uudis Saturni kuust - proovime Tartu Ülikooli vastset tõlkemootorit
Uudse lahenduse abil saab kasutaja mõtestatult ja soravalt tõlkida eesti keelde, öeldakse tänases pressiteates. „Siiani on sarnased masintõlke rakendused kasutanud statistilisi meetodeid, mis tõlgivad fraaside kaupa ning tihti ei sobitu lõpptulemus konkreetsesse konteksti. Neurovõrkudel töötav tõlge annab võimaluse rohkem ja rikkalikumat infot töödelda ning selle tulemusena on ka rakenduse väljund kvaliteetsem,“ sõnas ametlikus teadaandes keeletehnoloogia õppetooli juhataja dotsent Mark Fišel.
Fišel lisas, et Google-i automaattõlke teenus juba kasutab sarnast lahendust, kuid hetkel on see kättesaadav vaid 15 keelepaari jaoks – peamiselt inglise keelest teistesse keeltesse tõlkides. „Eestikeelset tõlget teeb Google Translate endiselt statistiliste meetoditega, mis tähendab seda, et meie rakendusel on suurem tõenäosus anda kvaliteetsemat tõlketulemust,“ ütles ta.
Tööriist on kättesaadav aadressilt http://neurotolge.ee/ ning kasutajatel on võimalik ka ise selle kvaliteedi tagamisele ja mootori parendamisele kaasa aidata. Nimelt pakub rakendus sisestatud teksti juurde alternatiivseid tõlkeid teenustest Google Translate ja Tilde masintõlge ning kasutaja saab pärast nupule "Mängi" vajutamist märkida, milline kolmest tema jaoks kõige õigem tundub. Selle valiku abil on Tartu Ülikooli tõlkemootor võimeline õppima ja oma tõlkeoskusi parandama. Tulevikus lisandub tõenäoliselt võimalus tõlkida eesti keelest lisaks inglise keelele ka läti, vene ja soome keeltesse.
Katsetasime uut mehhanismi võrdluses Google`i tõlkemehhanismiga, kasutades kolme erinevat inglisekeelset teksti. Esimene erinevus, mis tartlaste tõlkemootori puhul kohe silma hakkab, on selle aeglus. Kui Google`i Translate annab vastuse (olgu see siis hea või halb) praktiliselt hetkega, siis Tartu mootor jahvatab üpris mõõdukas tempos. Mõne vastuse saamiseks läks lausa poolteist kuni kaks minutit.
Esmalt Celine Dioni superhiti „My Heart Will Go On“ refrään. Selle sõnad on inglise keeles sellised: „Near, far, wherever you are - I believe that the heart does go on. Once more you open the door. And you're here in my heart and my heart will go on and on.“
Google Translate: Near kaugel, kus iganes sa oled. Usun, et süda ei lähe. Veelkord avate ukse. Ja sa oled siin minu südames ja minu süda läheb edasi ja edasi.
Neurotolge.ee: Ta on kaks korda abielus. Ma usun, et süda läheb edasi Ava uks. Ja sa oled siin mu südames ja mu süda läheb edasi ja edasi.
Nagu näha, on tartlaste versioonis üsna jahmatav avalause, mille tõlkemootor ka teisel katsel välja pakkus (tundus korraks, et äkki sai esimesel korral ise midagi valesti tehtud).
Teiseks võtsime George Orwelli düstoopilise romaani "1984" avalause. See on inglise keeles selline: "It was a bright day in April, and the clocks were striking thirteen." Ehk siis vabas tõlkes: "see oli ere aprillipäev ja kellad olid parasjagu kolmeteistkümnendat tundi löömas."
Neurotolge.ee: Aprillis oli see eredavam päev ja kellad olid kolinud.
Teisel katsel mõnikümmend minutit hiljem pakkus mootor, et "aprillis oli see eredavam päev ja kellad olid kolmeteistkümnes," mis on juba mõnevõrra parem, ehkki omadussõna "eredavam" on siiski pehmelt öeldes küsitav.
Ja kolmandaks katsetasime, kuidas saavad mõlemad tõlkemootorid võrdluses hakkama teadusuudiste portaali ScienceNews artikliga Saturni kuust Enceladusest, täpsemalt selle avalausega. See oli niisugune: "Saturn´s icy moon Enceladus packs snacks suitable for microbial life," mida võiks üsna vabalt tõlkida kui "Saturni jäisel kuul Enceladusel leidub mikroobsele elule sobivaid suupisteid."
Google Translate: Saturni jäine moon Enceladus pakkides suupisted sobivad mikroobide elu.
Neurotolge.ee: Saturni jäine kuu on sisseehitatud mikroobide eluks.
Sedapuhku on Saturni jäise kaaslase nimi kusagile täiesti ära kaotatud ning ka sisseehitusest pole tegelikult originaalis juttu.
Seega võiks esimese kiire pilgu põhjal kokkuvõtteks öelda, et kuigi uus tõlkemootor on küll osav seosetelooja, kipub ta aeg-ajalt ehk isegi natuke liiga kaugele minema ja tegema seesuguseid järeldusi, mille osadel pole algtekstiga suurt pistmist.
Samas on ka parimate lahenduste algus peaaegu alati raske, nii et loodetavasti saab tartlaste neurotõlkemootor juba õige pea palju paremaks. Selle kasuks räägib fakt, et tõlkemootorit on võimalik ka ise parendada, kasutades lehel "Mängi" funktsiooni.