Asi on selles, et Google’il on kõikide oma teenuste jaoks, alates Gmailist kuni Google Mapsini, sama koodibaas, mis sisaldab enam kui kaht miljardit koodirida. Need asuvad umbes miljardis failis, mille suurus kokku on umbes 86 terabaiti.

Sellised andmed tõi avalikkuse ette vähemalt Google'i inseneeriadirektor (engineering manager) Rachel Potvin möödunud septembris konverentsil @Scale.

See massiivne andmekogu asub korraga kümnes andmekeskuses üle maailma, mis infot kogu aeg peegeldavad ja täiendavad. „Koodibaas mitte ainult ei kasva, vaid teeb seda veel kasvavas tempos,“ kommenteerib ta.

Ühtse koodibaasi käigushoidmisel on hea põhjus: infole on kergem ligi pääseda ja seda täiendada. Kõik need koodiread on kättesaadavad pidevalt 95 protsendile Google’i inseneridest. Iga muudetud / täiendatud rida uuendatakse kohe ka igas veebiteenuses, mis seda kasutab.

Potvin ütleb, et iga nädal täiendatakse või muudetakse umbes 15 miljonit koodirida umbes 250 000 failis.

„Kui alguse saab uus projekt, siis on arendajate käsutuses kohe terve varakambritäis valmiskirjutatud koodi. Peaaegu kõik vajalik on pea kõigil juhtudel juba olemas ja ootamas!“