Digitalna arheologija

Opšta je mudrost da se stvari u IT industriji razvijaju velikom brzinom, čak i u zemljama poput Srbije, gde vreme, čini se, protiče nešto sporije. Nove, moćnije mašine sve brže i brže smenjuju i potiskuju one starije, koje u svojoj nemoći da sačuvaju relevantnost počinju da se okupljaju po ćoškovima, podrumima i skladištima,  pružajući pasivan otpor time što skupljaju prašinu i jednostavno nam smetaju. Međutim, kada govorimo o podacima pohranjenim na tim mašinama, nije u pitanju samo fizička memorija koja veoma brzo zastareva, već i formati u kojima su ti podaci sačuvani. Kako se metodi za čuvanje podataka razvijaju, informacije pohranjene u starijim strukturama postaju sve manje i manje pristupačne, a u zavisnosti od njihove otpornosti na propadanje prisutna je i opasnost da te informacije budu izgubljene jednom za svagda.

Tu nastupaju “informacioni arheolozi”, stručnjaci koji se bave spašavanjem istorijskih podataka iz takvih izvora i njihovim prevođenjem u format koji je aktuelan i u kom bi se one mogle dalje koristiti. Kao takva, “digitalna arheologija” (Data Archeology ili Digital Archeology) bliska je i prepliće se s granama računarske nauke kao što su “spašavanje podataka” (Data Recovery), “pretraživanje podataka” (Data Mining) ili “prikupljanje znanja iz baza podataka” (Knowledge Discovery in Databases), pri čemu njenu differentia specifica čini upravo činjenica da je prvenstveno usmerena na istorijske izvore i da za osnovni cilj ima ne samo spašavanje podataka, već i njihovo razumevanje i “prevođenje” u novije formate. Tako se informaciona arheologija u ovom trenutku najčešće koristi kako bi se spasili i prikupili podaci sa magnetskih traka, IBM-ovih bušenih kartica, ketridža, flopi diskova i drugih medija za skladištenje podataka koji su danas izašli iz upotrebe.

Digitalna arheologija naročito je relevantna za dobijanje podataka iz velikih baza akumuliranih tokom naučnih istraživanja (iz oblasti klimatologije, demografije, medicine, astronomije i dr) ili aktivnosti većih ili manjih poslovnih subjekata. Upravo je iz potrebe za prikupljanjem i sistematizovanjem naučnih podataka na globalnom nivou došao i glavni podsticaj za razvoj informacione arheologije; sam pojam se po prvi put sreće oko 1993. godine, kada je pokrenut projekat GODAR (Global Oceanographic Data Archaeology and Rescue Project) s ciljem sistematizovanja informacija iz oblasti okeanografije prikupljenih u različitim delovima sveta, kao i njihovog digitalizovanja kako bi se te informacije sačuvale i učinile dostupnim svim naučnicima koji se bave praćenjem globalnih klimatskih promena. Stoga je u okviru ovog projekta informaciona arheologija bila definisana kao “rekonstrukcija nekadašnjih klimatskih prilika i drugih aspekata globalnih kretanja, koja obuhvata pronalaženje, obnavljanje, ispravljanje i interpretiranje setova podataka iz prošlosti”.

Postoji nekoliko grupa faktora koji nepovoljno utiču na proces obnovljanja podataka sa starih medija:

1. Oštećenost samog medija, usled:

  • izloženosti visokim temperaturama,
  • uskladištenosti u uslovima velike vlažnosti vazduha,
  • izloženosti magnetnim i elektro-magnetnim uticajima,
  • istrošenosti usled dugotrajne upotrebe, ili
  • greške proizvođača;

2. Gubitak funkcionalnosti pristupnih uređaja, usled:

  • tehnološke zastarelosti,
  • sklonosti ka kvarenju pojedinih komponenti samog uređaja (masovna proizvodnja uticala je na to da se uređaji izrađuju od komponenti slabijeg kvaliteta), ili
  • činjenice da drajveri unutar starijeg hardvera obično nisu podržani u  novijem hardveru;

3. Promene u hardveru i operativnim sistemima zbog kojih više nije moguće dobiti istu funkcionalnost;
4. Gubitak sposobnosti prezentovanja podataka usled razvoja i zastarevanja audio-video tehnologije;
5. Slabih tačaka u procesu kreiranja, skladištenja i dokumentovanja, kao na primer:

  • u situaciji kada je moguće iščitati promene u magnetskom polaritetu i time obnoviti originalne bitove sa samog medija, ali nakon čega nije moguće interpretirati podatke zbog toga što nije poznata strategija kodiranja,
  • u situaciji kada nije moguće dekodirati podatke zbog nepostojanja dokumentacije u kojoj je sadržan ključ za dekodiranje, ili
  • u situaciji kada je primenjen nepoznat algoritam za kompresiju pre nego što su podaci kodirani i ispisani na datom mediju.

Budući da sve veća količina informacija biva stvarana i čuvana u digitalnoj formi, za očekivati je da će ubrzani razvoj i širenje kompjuterskog hardvera i softvera, različitih operativnih sistema i režima digitalnog kodiranja u budućnosti dodatno naglasiti probleme vezane za njihovo zastarevanje. Iako digitalni mediji omogućavaju lakše kreiranje, obradu i razmenu podataka, oni su s druge strane znatno podložniji zastarevanju i fizičkom propadanju od svojih analognih prethodnika. Tako, na primer, dok jedan dokument ispisan na papiru može ostati sačuvan hiljadama godina, trenutno ne postoji tehnologija koja bi omogućila nešto slično (koliko mi je poznato, crno-beli mikrofilmovi mogu ostati čitljivi oko 1000 godina, dok se za mikrofilmove u boji očekuje da traju tek oko 100 godina; životni vek jednog CD-R baziranog na AZO je tek 10-20 godina, dok je ta cifra nešto viša kod onih baziranih na ftalocijaninu i kreće se oko 100 godina).  Ovi problemi dodatno su naglašeni nepostojanjem utvrđenih standarda i protokola za čuvanje digitalnih podataka, što u ovom trenutku za informacione arheologe čini budućnost krajnje izvesnom.

Leave a Reply

%d bloggers like this: