Meie e-riik on tänaseks üle 20 aasta vana. Just aastatel 2000 – 2001 toimusid mitmed arengud mille tulemusel hakati järjest enam infot digitaalseks viima. Mainigem siinkohal näiteks digitaalset allkirjastamist, eesti.ee portaali ning andmevahetuskihti X-Tee, mis kõik käivitati just 2001. aastal.
Ka paljud meie riigi tähtsamad registrid ja andmebaasid on mitu aastakümmet vanad. Kui algusaastatel toimisid digitaalsed süsteemid peamiselt paber- ja (väheste) digitaaldokumentide registrina, siis aja jooksul on järjest rohkem olulist teavet liikunud struktureeritud andmetena asutuse töövoogude ja andmebaaside sisse. Sellised andmed ei ole enam seotud konkreetse paberilehe või PDF faili kujundusega, ehk kadunud on üksühene seos dokumendi vormingu ja sisu vahel.
Siit tekib omakorda küsimus – kas tänapäevasel „andmete ajastul“ on traditsioonilised dokumendi- ja arhiivihalduse tegevused nagu liigitamine, väärtuse hindamine, hävitamine ja arhiveerimine endiselt olulised? Või on jällegi parem, kui kõik andmed jäävad igavesti alles just sinna süsteemi, kus nad eelnevalt loodud on?
Rahvusarhiivi seisukohast on vastus ühene: ka andmetena esineva teabe haldamine ja arhiveerimine on tähtis. Sellesse infokirja olemegi kogunud kuus põhjust, miks asutus peab andmebaasides paikneva teabe elutsüklit haldama, andmebaase arhiveerima ning millist kasu see asutusele annab.
Mis on andmebaasi arhiveerimine?
Andmebaasi arhiveerimine on protsess, mille käigus loetakse andmebaasist välja väärtuslikud andmed, seosed ja päringud ning salvestatakse need laialt levinud, standardsetesse ja stabiilsetesse vormingutesse (XML, CSV, SQL). Selliselt arhiveeritud andmeid on võimalik hiljem päringute tegemiseks ja taaskasutamiseks laadida ükskõik millisesse levinud andmebaasiplatvormi.
Rohkem infot andmebaaside arhiveerimise kohta leiad Rahvusarhiivi veebilehelt: www.ra.ee/andmebaasid
1) Andmete pikaajaline kasutatavus
Aktiivse infosüsteemi andmete kasutamine on enamasti võimalik läbi eeldefineeritud päringute ja e-teenuste. Sellised teenused on loodud kasutajate hetkevajaduste jaoks, optimeeritud kiirusele ja edastavad kasutajale minimaalse, teenuse skoobis oleva andmete alamhulga. Samuti on päringud ja teenused tihedalt seotud infosüsteemi tehnilise ülesehitusega ning need vananevad ja muutuvad koos infosüsteemi endaga.
Rahvusarhiivis arhiveeritud andmestikke hoitakse pikaajaliselt stabiilses vormingus, mille kasutusvõimalused on oluliselt laiemad. Lisaks lihtsamatele üksikpäringutele saab kasutaja moodustada andmestikust ise erinevaid väljavõtteid, teostada kvantitatiivseid uuringuid, analüüsida aegridasid jne.
2) Andmekaitse nõuete täitmine
Digitaalse ühiskonna arenedes on järjest põhjalikumaks läinud ka nõuded infosüsteemidele ja andmete riskide haldamisele, eriti andmete avalikustamisele ja isikuandmete kaitsele. Hetkel kehtiv isikuandmete kaitse üldmäärus (GDPR) sätestab üheselt õiguse olla unustatud ja määrab asutustele kohustuse hävitada või arhiveerida andmed, mille töötlemise vajadus (praktikas: asutuse poolt õigusakti alusel määratud säilitustähtaeg) asutuse jaoks on möödunud. Seega tuleb määruse nõuete täitmiseks isikuandmeid sisaldavad andmestikud regulaarselt arhiveerida ning isikuandmed asutuse infosüsteemides kas hävitada või pseudonümiseerida.
3) Teabe vormingute ja struktuuri muutumine
Viimase paarikümne aastaga on toimunud oluline muutus teabe salvestamiseks kasutatavas vormingus ja struktuuris – oleme liikunud paberilt digitaalseks. Samas, mida rohkem on andmebaasidesse ladestunud erinevatest ajastustest pärinevaid erinevates vormingutes ja struktuurides andmeid, seda keerulisem on asutuse andmehalduse korraldamine, taristu haldamine ja e-teenuste osutamine.
Vanemate, eelkõige igapäevaselt mittevajalike, andmete regulaarne arhiveerimine (või hävitamine) võimaldab asutusel hoida oma aktuaalsed andmed ühtlustatud kujul ning seeläbi lihtsustada nii andmete kui infotehnoloogilise taristu haldust. Viimane annab omakorda kokkuhoiu igapäevastes tegevuskuludes.
4) Teabe migreerimine tehnoloogia põlvkondade vahel
Sarnaselt eelmisele punktile lihtsustab regulaarne arhiveerimine ja hävitamine teabe migreerimist erinevate platvormide vahel. Infosüsteemide tehnoloogilised platvormid vananevad ning aeg-ajalt on neid vaja uuendada või välja vahetada, millega kaasneb ka andmebaaside andmemudelite uuendamise vajadus. Üldise trendina on näha, et viimase 20 aasta IT arendusprojektides ongi pidevalt kasvanud just vanemate andmete migreerimise maksumus (ja selle osakaal kogu projekti maksumusest).
5) Andmete hävimise riski maandamine
Tänapäeval teeb enamus asutusi oma andmebaasidest regulaarselt varukoopiaid, kuid erandlikes olukordades võivad ka varukoopiad samaaegselt andmebaasiga hävineda. Samas võidakse avastatakse andmekadu alles mõne aja möödudes, kui vaikimisi varukoopiad on juba üle kirjutatud või pole enam taastatavad.
Andmebaaside arhiveerimisel tehtav tõmmis põhineb avatud ja pikaajaliselt kasutataval vormingul. Selliselt loodud tõmmis võimaldab asutusel maandada andmekao riske ning tagada vajalike andmete säilivuse kasutatavana ja autentsena nii kaua, kui vaja.
6) Arhiiviseaduse täitmine
Arhiiviseaduse kohaselt tuleb arhiiviväärtuslikuks määratud teave hiljemalt kümme aastat peale loomist Rahvusarhiivi üle anda. Ülevaate arhiiviväärtuslikuks määratud riigi andmekogudest saab aadressilt https://www.ra.ee/astra/site/databases. Kui sinu asutuse andmekogu on selles nimekirjas, siis arvesta andmete arhiveerimise vajadusega!
Andmebaaside maailm on kirju. Andmebaasides hoitava teabe iseloom on erinev ning andmete struktuur ja andmetega toimuvad protsessid sõltuvad konkreetsest valdkonnast. Põhjused andmebaaside arhiveerimiseks pole universaalselt kohalduvad kõigile andmebaasidele. Igal juhul on andmebaasides sisalduva teabe arhiveerimine oluline. Rahvusarhiiv tegutseb igapäevaselt selle nimel, et arhiveerimiseks kasutatavad vormingud, tööriistad ja protsessid oleksid asutustele mugavad ning arhiveeritud andmete taaskasutamine liiguks järjest paremale tasemele.