Zaštita Podataka – Blog Data Solutions Laboratorije

Arhiva za: April, 2012

O digitalnoj arheologiji

od autora: dana: Apr.30, 2012, u kategoriji Tehnologija

Opšta je mudrost da se stvari u IT industriji razvijaju velikom brzinom, čak i u zemljama poput Srbije, gde vreme, čini se, protiče nešto sporije. Nove, moćnije mašine sve brže i brže smenjuju i potiskuju one starije, koje u svojoj nemoći da sačuvaju relevantnost počinju da se okupljaju po ćoškovima, podrumima i skladištima,  pružajući pasivan otpor time što skupljaju prašinu i jednostavno nam smetaju. Međutim, kada govorimo o podacima pohranjenim na tim mašinama, nije u pitanju samo fizička memorija koja veoma brzo zastareva, već i formati u kojima su ti podaci sačuvani. Kako se metode za čuvanje podataka razvijaju, informacije pohranjene u starijim strukturama postaju sve manje i manje pristupačne, a u zavisnosti od njihove otpornosti na propadanje prisutna je i opasnost da te informacije budu izgubljene jednom za svagda.

Tu nastupaju “informacioni arheolozi”, stručnjaci koji se bave spašavanjem istorijskih podataka iz takvih izvora i njihovim prevođenjem u format koji je aktuelan i u kom bi se one mogle dalje koristiti. Kao takva, “digitalna arheologija” (Data Archeology ili Digital Archeology) bliska je i prepliće se s granama računarske nauke kao što su “spašavanje podataka” (Data Recovery), “pretraživanje podataka” (Data Mining) ili “prikupljanje znanja iz baza podataka” (Knowledge Discovery in Databases), pri čemu njenu differentia specifica čini upravo činjenica da je prvenstveno usmerena na istorijske izvore i da za osnovni cilj ima ne samo spašavanje podataka, već i njihovo razumevanje i “prevođenje” u novije formate. Tako se informaciona arheologija u ovom trenutku najčešće koristi kako bi se spasili i prikupili podaci sa magnetskih traka, IBM-ovih bušenih kartica, ketridža, flopi diskova i drugih medija za skladištenje podataka koji su danas izašli iz upotrebe.

Digitalna arheologija naročito je relevantna za dobijanje podataka iz velikih baza akumuliranih tokom naučnih istraživanja (iz oblasti klimatologije, demografije, medicine, astronomije i dr.) ili aktivnosti većih ili manjih poslovnih subjekata. Upravo je iz potrebe za prikupljanjem i sistematizovanjem naučnih podataka na globalnom nivou došao i glavni podsticaj za razvoj informacione arheologije; sam pojam se po prvi put sreće oko 1993. godine, kada je pokrenut projekat GODAR (Global Oceanographic Data Archaeology and Rescue Project) s ciljem sistematizovanja informacija iz oblasti okeanografije prikupljenih u različitim delovima sveta, kao i njihovog digitalizovanja kako bi se te informacije sačuvale i učinile dostupnim svim naučnicima koji se bave praćenjem globalnih klimatskih promena. Stoga je u okviru ovog projekta informaciona arheologija bila definisana kao “rekonstrukcija nekadašnjih klimatskih prilika i drugih aspekata globalnih kretanja, koja obuhvata pronalaženje, obnavljanje, ispravljanje i interpretiranje setova podataka iz prošlosti”.

Postoji nekoliko grupa faktora koji nepovoljno utiču na proces obnovljanja podataka sa starih medija:

1. Oštećenost samog medija, usled:

  • izloženosti visokim temperaturama,
  • uskladištenosti u uslovima velike vlažnosti vazduha,
  • izloženosti magnetnim i elektro-magnetnim uticajima,
  • istrošenosti usled dugotrajne upotrebe, ili
  • greške proizvođača;

2. Gubitak funkcionalnosti pristupnih uređaja, usled:

  • tehnološke zastarelosti,
  • sklonosti ka kvarenju pojedinih komponenti samog uređaja (masovna proizvodnja uticala je na to da se uređaji izrađuju od komponenti slabijeg kvaliteta), ili
  • činjenice da drajveri unutar starijeg hardvera obično nisu podržani u  novijem hardveru;

3. Promene u hardveru i operativnim sistemima zbog kojih više nije moguće dobiti istu funkcionalnost;
4. Gubitak sposobnosti prezentovanja podataka usled razvoja i zastarevanja audio-video tehnologije;
5. Slabih tačaka u procesu kreiranja, skladištenja i dokumentovanja, kao na primer:

  • u situaciji kada je moguće iščitati promene u magnetskom polaritetu i time obnoviti originalne bitove sa samog medija, ali nakon čega nije moguće interpretirati podatke zbog toga što nije poznata strategija kodiranja,
  • u situaciji kada nije moguće dekodirati podatke zbog nepostojanja dokumentacije u kojoj je sadržan ključ za dekodiranje, ili
  • u situaciji kada je primenjen nepoznat algoritam za kompresiju pre nego što su podaci kodirani i ispisani na datom mediju.

Budući da sve veća količina informacija biva stvarana i čuvana u digitalnoj formi, za očekivati je da će ubrzani razvoj i širenje kompjuterskog hardvera i softvera, različitih operativnih sistema i režima digitalnog kodiranja u budućnosti dodatno naglasiti probleme vezane za njihovo zastarevanje. Iako digitalni mediji omogućavaju lakše kreiranje, obradu i razmenu podataka, oni su s druge strane znatno podložniji zastarevanju i fizičkom propadanju od svojih analognih prethodnika. Tako, na primer, dok jedan dokument ispisan na papiru može ostati sačuvan hiljadama godina, trenutno ne postoji tehnologija koja bi omogućila nešto slično (koliko mi je poznato, crno-beli mikrofilmovi mogu ostati čitljivi oko 1000 godina, dok se za mikrofilmove u boji očekuje da traju tek oko 100 godina; životni vek jednog CD-R baziranog na AZO je tek 10-20 godina, dok je ta cifra nešto viša kod onih baziranih na ftalocijaninu i kreće se oko 100 godina).  Ovi problemi dodatno su naglašeni nepostojanjem utvrđenih standarda i protokola za čuvanje digitalnih podataka, što u ovom trenutku za informacione arheologe čini budućnost krajnje izvesnom.

3 komentara :, vise...
  1. Autor ovog članka, Ivan Šentevski o sebi piše:

    Po obrazovanju antropolog, po zanimanju veb zanatlija. Dugogodišnji prijatelj kompanije "Data Solutions". Sklon pisanju o temama na razmeđi dvaju svetova, sveta ljudi i sveta računara. Ponosan na činjenicu da do sada nijednu kafu nisam prosuo po kompu. Svojski se trudim da tako i ostane, ali se plašim da moj mačak ima nešto drugačije namere.

Na blogu još o tome pišu...

  1. 25 godina “Flash” memorije

    Ove se godine navršava 25 godina od kada je Toshiba komercijalizovala izum Dr. Fujio Masuoke, flash memoriju. Dr. Masuoka je dizajnirao prve flash memorije u laboratorijama Toshibe početkom osamedesetih godina prošlog veka, a anegdota kaže da je ime “flash” poteklo od kolege Shoji Arziumija koga je proces brisanja memorije asocirao na blic sa kamere ili [...]

    Autor: Igor Šestanj | Objavljeno u kategoriji: Tehnologija

  1. bubke

    Backup u oblaku

    Skladištenje podataka u “oblaku” postalo je dostupno svima. Prednosti ovakvog načina skladištenja uvidele su kako velike kompanije, tako i pojedinci. Sve što je potrebno da bi Vam podaci uvek bili dostupni je Internet konekcija i uređaj kojim pristupate Internetu. Više nije bitno da li je to desktop računar, laptop računar, tablet ili smart phone. Ali [...]

    Autor: bubke | Objavljeno u kategoriji: Tehnologija

Showcase

Kako su nastali kompjuterski virusi?

Prvi akademski rad o teoriji kompjuterskih virusa (iako termin "kompjuterski virus" još nije bio u upotrebi u to vreme) je zabeležen 1949. godine od strane John von Neumann-a koji je držao predavanja na Univerzitetu u Illinoisu o 'teoriji i organizaciji kompleksnih automata ". Rad von Neumann-a je kasnije objavljen kao "Teorija o samo-reprodukciji automata". U svom eseju von Neumann je opisano kako kompjuterski program može biti projektiran tako da se sam reprodukuje.

Godine 1972. Veith Risak je objavio članak "Samo-reprodukujući automati sa minimalnom razmenom informacija". U članku se opisuje potpuno funkcionalni virus napisan u asembleru za SIEMENS računarski sistem 4004/35, a mnogi smatraju da je prvi pravi predak današnjih virusa bio je Prevading animal koji je bio sposoban da se nadodaje na druge programe na UNIVAC 1108 računarskom sistemu.