Unicode on tähtede kodeerimisstandard, mis hõlmab erinevaid tähestikke, alates araabia konksudest kuni kõikvõimalike täpi- ja kriipsutähtedeni. ASCII kümneid aastaid vana standard seevastu mahutab ainult kas 128 või 256 tähte.

Unicode sai ASCII’st ja Western European standardist jagu möödunud detsembri esimese kümne päevaga.

Google on Unicode fänn. Kui Google töötleb mõne „mitte Unicode“ veebilehe andmeid, konverteerib ta need esmalt Unicode standardisse, mis parendab mitmekeelse otsingu võimalusi.

Davise sõnul on Google vastselt üle läinud Unicode 5.1 versioonile, nii saavad näiteks Malaid panna toime otsinguid omas märgistikus.

Siiski on Unicode’l ka üks puudus — ühe tähe kood nõuab tänu tükk maad suuremale tähtede arvule palju rohkem baite kui üks märk ASCII standardis.