Andmekaevur ennustab tulevikku ette algoritmide abil
Timo Sulg on tavapäraselt tagasihoidlik IT mees. Ta õpib Tallinna Tehnikaülikoolis. Haruldane on tema puhul aga see, et kui tavaliselt hakkavad TTÜ tudengid programmeerima või sukelduvad veebiärisse, siis Timo on kaevur. Andmekaevur!
Mõni aeg tagasi avastas Timo enda jaoks arvutiteaduse moodsa haru nimega andmekaeve (inglise keeles data mining), millega Eestis tegeletakse vähe. Sellest ajast on ta ahminud endasse teema kohta üüratu hulga infot, näiteks lugenud suure hulga teadusartikleid. Ta esitas oma äriidee Tehnopol ja Tartu Teaduspargi ühiskonkursile StartITup ning pani selle ka kinni! Nüüd lihvitakse Timo äriplaani mitmekesi.
Aga milles on asja uba? Andmekaeve on erinevate algoritmide ja mudelite alusel suure hulga andmete analüüs, et leida sealt konkreetseid trende või mustreid. Andmeid on maailmas meeletu hulk: mida ostame, kus liigume, mida arvutis klikime jne. Näiteks kui töötada läbi kõik ühe kuu jooksul Selverites tehtud ostud, võib neist välja lugeda mida inimesed teatud päevadel rohkem eelistavad ning vastavalt sellele ümbr kujundada sortimenti. Pangad saavad lihtsa vaevaga andmekaeve abil meile uusi laenutooteid pakkuda. Kindlustusfirmad analüüsivad aga selle abil meie tõenäolist eluiga.
Meie saaks oma oste analüüsides näha kokkuhoiuvõimalusi. „Mina tahan luua praktilise analüütilise platvormi, mida saaksid kasutada mitte ainult suured korporatsioonid, vaid ka väikefirmad ja eraisikud, et suurest hulgas andmetest erinevat kasulikku infot välja töödelda,“ räägib Sulg.
Timo ei alusta päris tühjalt kohalt. Hetkel töötab ta Soome firma HRMi heaks, analüüsides selle töötajate liikumist ja motivatsiooni. „Ma otsin mustreid. Panen algoritmid valmis ja lasen need andmetest üle, juues ise vahepeal kohvi!“ ütleb ta.
Samuti on ta vaadelnud toornafta hinna liikumist maailmaturul, kuid pole enda sõnul midagi üllatavat tuleviku kohta saanud. Ilmselt pole kellelegi uudis, et nafta hind saab ainult kasvada. Aga milline võiks olla optimaalne elektritootmine ühe riigi jaoks, et saavutada parim hinnatase? Timo arvutis pesitsevad algoritmid juba teavad.
Ka kevadiste valimiste tulemusi on ta põhimõtteliselt valmis ette ennustama. Iseasi, millised andmed algoritmide kätte töötlemiseks anda. Kas eelmiste valimiste tulemused, poliitikute aktiivsus riigikogus ning meedias või veel midagi? Mida rohkem on andmetes muutujaid, seda usaldusväärsemad mustrid neist välja kooruvad. Võib küll juhtuda, et Bangladeshi juustutootmise põhjal ennustatakse täpselt ära aktsiahindade liikumine Nasdaqil, kuid seda saab Timo arvates pidada vaid pimedaks juhuseks.
Timo ütleb, et tema klientideks ei pea tulevikus ilmtingimata inimesed olema, vaid teised arvutid, sest andmete analüüs saaks toimuda automaatselt.
Tehnopolis Timot nõustav Raido Pikkar näeb noormehe projektis pisikest sammu iseareneva ja mõtleva tehisintellekti suunas, millest on meedias sõna võtnud ka Skype’i endine insener Jaan Tallinn.
Jälgi Forte uudiseid ka Twitteris!