Nors informacijos kiekis kasdien auga, jos dalis tampa nepasiekiama dėl svetainių uždarymo, technologinių pokyčių ar kitų priežasčių. Tačiau su tuo kovoja interneto archyvistai. „Telia“ pasakoja, kas jie ir kodėl jų darbas yra svarbus mūsų istorijos išsaugojimui.
„Pew“ tyrimų centro duomenimis, 38 proc. 2013 m. veikusių internetinių puslapių šiandien yra nepasiekiami. Vis dėl to nyksta ne tik sena ir nebeaktuali informacija – maždaug 8 proc. 2023 m. pasauliniame tinkle patalpintų svetainių buvo dingusios dar tais pačiais metais.
„Pagal išlikusius papiruso fragmentus ir mozaikas šiandien galime žinoti, ką Pompėjos gyventojai valgė pusryčiams prieš du tūkstančius metus. Paradoksalu, bet šiandienos gyvenimui vis labiau keliantis į skaitmeninę erdvę kyla grėsmė, kad apie mūsų dienų aktualijas nebesužinos net mūsų vaikų vaikaičiai. Šia problema rūpinasi interneto archyvistai, ateities kartoms saugojantys internetinių puslapių kopijas. Tačiau jų darbas nėra toks paprastas – turinio kūrėjai priešinasi archyvavimui, archyvistai dažnai balansuoja ties duomenų apsaugos pažeidimo riba, o viską papildomai apsunkina techninės kliūtys“, – teigia „Telia“ išmaniųjų įrenginių ekspertas Marijonas Baltušis.
Dingsta tiek tyčia, tiek netyčia
Internetinis tinklapis, priešingai nei piešinys olos viduje, negali informacijos saugoti tūkstančius metų be jokių papildomų jo autoriaus pastangų. Puslapio savininkui reguliariai tenka mokėti už domeno registracijos palaikymą, taip pat – už svetainės talpinimą. Nors daugeliu atvejų tai nėra ypač dideli pinigai, tinklapius valdančios bendrovės kai kada bankrutuoja, vienus naujienų portalus nuperka kiti, turinį internete talpinę žmonės pereina prie kitų veiklų, taip savo pėdsaką internete pasmerkdami išnykti.
Kartais informacija pasauliniame tinkle tampa nepasiekiama net per klaidą ar neapsižiūrėjimą. Atnaujinant internetines svetaines ir keičiant jų struktūrą, tam tikra dalis senų jų nuorodų tampa nepasiekiamos, nes idealiai tiksliai perkelti duomenis iš senosios versijos reikalauja neracionaliai daug laiko ir lėšų, o kai kada – apskritai neįmanoma. Tą ypač gerai iliustruoja dabartinė Vikipedijos situacija – „Pew“ skaičiavimais, daugiau negu pusė šios internetinės enciklopedijos straipsnių šaltinių grafoje turi bent vieną neveikiančią nuorodą. Ši problema ypač gaji ir įvairiuose valstybiniuose ištekliuose – nuorodų į nebeveikiančius puslapius galima rasti penktadalyje institucijų svetainių.
„Taip pat pasitaiko atvejų, kai interneto istoriją savo rankomis sunaikina patys jos kūrėjai. Štai vienas žinomiausių technologijų naujienų portalų „CNET“ prieš metus tyčia ištrynė dešimtis tūkstančių savo patalpintų straipsnių. Puslapio vadovybė tai motyvavo noru pasikelti poziciją „Google“ paieškos reitinge, kuris neva prioritetą teikia naują ir aktualų turinį skelbiantiems portalams. Laimė, skaitytojams pradėjus protestuoti ir šią praktiką suskubus pasmerkti pačiai „Google“, kompanija vėliau nuo šio sprendimo atsitraukė ir prižadėjo atkurti technologijų istorijai gyvybiškai svarbią medžiagą“,– pasakoja M. Baltušis.
Interneto istorija rūpinasi entuziastai
Jei kada nors atsitrenkėte į neveikiančios nuorodos „sieną“, tai dar nebūtinai reiškia, kad jos turinys yra išnykęs amžiams. Dešimtmečius veikiantis projektas „Wayback Machine“ į pasaulinio tinklo labirintą kiekvieną dieną „išsiunčia“ visą eilę robotų, kurie kruopščiai kopijuoja ir išsaugo nuolat besikeičiančius internetinius puslapius. Kartais svetainių kopijavimas įvyksta net kelis kartus per dieną, todėl visuomenė bet kuriuo metu nemokamai gali „pasiknaisioti“ interneto praeityje ir surasti tai, kas dingo ar buvo tyčia sunaikinta.
1996 m. kaip interneto pionieriaus Brewsterio Kahlo hobis startavęs projektas, be 866 milijardų išsaugotų interneto svetainių, šiandien taip pat yra sėkmingai archyvavęs 44 milijonus knygų, 10,6 milijono vaizdo įrašų ir televizijos programų. Tad nors vadinamieji interneto archyvistai yra tik entuziastai, jų veikla yra kone vienintelis būdas ateities kartoms palikti mūsų sukauptą patirtį ir istoriją.
Ir „Wayback Machine“ nėra vieninteliai, besirūpinantys interneto palikimu. JAV Kongreso biblioteka archyvuoja valstybinius šios šalies puslapius ir tam tikrų naujienų portalų kolekciją. „UK Web Archive“ kasmet bent kartą nukopijuoja visus Jungtinės Karalystės tinklapius, turinčius .UK domeno adresą, o 2022 m. grupė savanorių pasiryžo išsaugoti Ukrainos internetą, jei jį pavyktų sunaikinti Rusijos kibernetinėms atakoms.
„Kita vertus, interneto archyvai egzistuoja ne vien tam, kad anūkams galėtume parodyti savo studijų laikais rašytą tinklaraštį ar paminėjimą spaudoje. Be jų šiandien sunkiai galėtų veikti valstybės, įmonės ir net teisiniai procesai. Štai 2014 m. archyvuotas Ukrainos separatistų lyderio Igorio Girkino socialinio tinklo įrašas padėjo įrodyti jo kaltę numušant civilinį Malaizijos oro linijų lėktuvą, „Wayback Machine“ sukauptas turinys gali nulemti, ar išradimas bus užpatentuotas Europos patentų tarnyboje, o įmonės šį įrankį neretai pasitelkia, norėdamos ištirti konkurentus į sėkmę atvedusią strategiją“, – aiškina ekspertas.
Nuo atakų iki milžiniškų ieškinių
Kad ir kokia kilini būtų interneto archyvistų misija, toli gražu ne visi suinteresuoti jos tęstinumu. Nepalankios informacijos išsaugojimu nepatenkinti subjektai organizuoja į archyvus nukreiptas kibernetines atakas, o griežtėjančios duomenų bei autorinių teisių apsaugos normos interneto archyvistus klampina teismuose. „Skaitmeniniams istorikams“ taip pat darosi daug sunkiau archyvuoti modernius puslapius ir užtikrinti, kad patys archyvai niekur nedingtų.
Bendrasis duomenų apsaugos reglamentas (BDAR) labai apsunkina interneto archyvistų veiklą, nes jie privalo iš archyvuotos medžiagos pašalinti asmeninius duomenis, kas automatizuotame procese yra labai sudėtinga užduotis. Archyvų kūrėjams ne ką lengviau naviguoti ir sudėtinguose autorinių teisių įstatymuose. Garsiausios muzikos įrašų studijos iš „Wayback Machine“ šiuo metu siekia prisiteisti beveik 400 mln. eurų sumą už jų įrašų skaitmenizavimą, kas šią pelno nesiekiančią organizaciją gali priversti nutraukti savo veiklą.
Pajusti gyvenimo be interneto archyvų skonį neretai leidžia ir įvairios kibernetinės atakos. 2023 m. spalį programišiai išjungė „UK Web Archive“ sistemas, o šiam archyvui iki galo atstatyti savo veiklos nepavyko net praėjus metams. Šių metų gegužę panašaus likimo sulaukė ir „Wayback Machine“, kuri patyrė didžiausią Paskirstytosios aptarnavimo perkrovos ataką (DDoS). Nors išpuolis ir buvo sustabdytas, kuriam laikui sustojęs archyvavimas paliko neatkuriamas „skyles“ mūsų istorijoje.
Lyg to būtų maža, interneto archyvų veiklai koją kišą daug judančio turinio turintys ar vartotojo veiksmų reikalaujantys internetiniai puslapiai, kuriuos labai sunku teisingai išsaugoti neturint sofistikuotų įrankių. Be to, dideliu galvos skausmu archyvams tampa milžiniškais tempais augantis informacijos internete kiekis, kurio saugojimo kaštai tampa sunkiai pakeliami gausiais finansiniais ištekliais negalintiems pasigirti interneto istorikams.
„Interneto archyvavimas yra daugiau nei techninis darbas – tai moralinė pareiga išsaugoti mūsų laikų istoriją ir kultūrą, kuri kitaip būtų pasmerkta išnykti amžiams. Kiekvieną dieną skaitmeniniame pasaulyje gimsta milijonai atradimų, tačiau be interneto archyvistų pastangų šios žinios gali dingti taip pat greitai, kaip ir atsirado. Šie specialistai savo darbu užtikrina, kad ateities kartos turėtų galimybę tyrinėti mūsų šiuolaikinį pasaulį ir mokytis iš to, kas jau įvyko, o mes galėtume įsivaizduoti save esant šių didžiulių permainų liudininkais net po daugelio metų“, – interneto archyvistų darbo esmę apibūdina „Telia“ išmaniųjų įrenginių ekspertas Marijonas Baltušis.