Google: Unicode tapab ASCII
Unicode’st on saanud internetis kõige populaarsem tähestikukodeerimise standard, kirjutab Google rahvusvahelise tarkvara vanemarhitekt Mark Davis oma blogipostituses. Sarnaselt on hääbumas Western European kodeering.
Unicode sai ASCII’st ja Western European standardist jagu möödunud detsembri esimese kümne päevaga.
Google on Unicode fänn. Kui Google töötleb mõne „mitte Unicode“ veebilehe andmeid, konverteerib ta need esmalt Unicode standardisse, mis parendab mitmekeelse otsingu võimalusi.
Davise sõnul on Google vastselt üle läinud Unicode 5.1 versioonile, nii saavad näiteks Malaid panna toime otsinguid omas märgistikus.
Siiski on Unicode’l ka üks puudus — ühe tähe kood nõuab tänu tükk maad suuremale tähtede arvule palju rohkem baite kui üks märk ASCII standardis.