Noé elektronikus bárkája
A digitális objektumok megőrzésének kérdései a közgyűjteményekben
Mi marad évszázadokon át papíralapon keletkezett és tárolt, majd a 20. század második felétől egyre inkább a digitális térben létrejövő információinkból, kultúránkból? Hogyan hosszabbítható meg az emberiség szellemi, művészeti, tudományos örökségének tárolási, olvashatósági élettartama? Milyen új kihívásokat, dilemmákat rejthet a muzeológia számára a digitális alapú információ feldolgozása és tárolása, a hozzáférés kérdései? A fentiekről és a témához kapcsolódó további izgalmas kérdésekről Horváth Dániel írásából tudhatunk meg többet.
Bevezető
Stanisław Lem egyik korai regényében, amely A fürdőkádban talált kézirat címet viseli, egy érdekes alaphelyzetet vázol fel. A több mint ezer évvel a szerző kora után játszódó, alternatív jövőben az emberiség úgy él, hogy semmit sem tud múltjáról, az őket megelőző korokról és évezredekről, így a 20. század eseményeiről sem. Ennek a tudatlanságnak az oka egy rejtélyes természeti kataklizma, amely a 20. század legvégén következett be, és amelynek hatására a Földön minden papír megsemmisült, velük együtt pedig az információk is, amelyeket ezek a papírok hordoztak. A beköszöntő zűrzavaros, kaotikus korszakban az emberiség tudósai összefogtak, hogy az űrutazáshoz szükséges technológiák alapjait új információhordozókra mentsék át, például vászonra vagy filmszalagokra, azonban a sürgős munka során háttérbe szorult minden, ami nem létfontosságú, így a humántudományok is. Ahogy Stanisław Lem fiktív jövőbeni történésze megfogalmazza:
„Végül, a kaotikus kor alkonyán, paradox helyzet alakult ki: fejlődött a gravitronika, a technobiotika, nagy űrhajók járták a galaktikát, de saját múltjáról szinte semmit sem tudott az emberiség. A neogén kor vívmányaiból csak összefüggéstelen töredékek maradtak ránk, a szájhagyományban elferdített, érthetetlen leírások; még a legfontosabb események időrendje is csupa fehér folt”.
A regényben a múltjától megfosztott emberiség történészei kétségbeesett kísérleteket tesznek arra, hogy a szájhagyomány és a kevés fennmaradt tárgyi emlék alapján rekonstruálják azt a korszakot, amikor a papírok megsemmisültek, a 20. század emberének korszakát. Megállapították, hogy az emberiség ekkor egy rendkívül primitív, archaikus vallás híve volt, amelyet „kapitalizmus”-nak hívtak, és célja a „dollár” néven emlegetett isten feltétel nélküli imádata volt. Más földrészeken más-más névvel illették ezt az istent, de mégis ez a vallás kötötte össze az emberiség különböző országait. A vallás papjait a „bróker” névvel illették, legfontosabb és legnagyobb temploma pedig a „Pentagon” névre hallgatott, ahol a vallás irányítói szent keresztes hadjáratokat, hittérítő stratégiákat dolgoztak ki.
Jól látható tehát, hogy Lem univerzumában az információhordozók megsemmisülése az információk későbbi jelentős torzulásával járt együtt. Mert, bármennyire is pontos Lem történészének priori meghatározása a kapitalizmus természetéről, természetesen bármelyik, napjainkban élő ember cáfolni tudná például azt a megállapítást, hogy a brókerek valamiféle szakrális értelemben vett papok volnának. Milyen jó – gondolhatjuk, ma, a 21. században –, hogy a mi valóságunkban nem semmisültek meg a papírok, és nem is fenyeget hasonló rejtélyes, elporladásukkal fenyegető kataklizma. Valóban, a papírjainkat nem semmisítheti meg egy világűrből váratlanul érkező járvány: elpusztítottuk őket mi magunk, amikor az információinkat áthelyeztük a digitális térbe.
A Long Now Rosetta Project nikkel- és titániumötvözetből készült lemeze. A kép forrása: Long Now Rosetta Project
A digitális tárgy ontológiája
A kérdés tehát az, hogy az új, digitális környezetbe került objektumaink és információink hogyan fognak az utókorra hagyományozódni és az új, tárolásukra szolgáló információhordozók hogyan tudják legalább olyan hatékonysággal megőrizni őket, mint tette azt a papír az elmúlt évszázadokban a múlt információval kapcsolatban. Jelenleg ugyanis a digitális térben létező információk hosszú távú megőrzése nem biztosított. A későbbi korok történészei – akárcsak Lem alternatív jövőjében – rendkívül keveset fognak tudni a 21. század elejének hétköznapjairól, mivel a közösségi média tartalmai, a messenger üzenetek, a „felhőben” tárolt anyagok, a floppyra, CD-re, DVD-re, merevlemezre mentett anyagok, valamint az e-mailek jelentős része el fog veszni. Ennek egyik alapvető oka az, hogy a jelenlegi, digitális objektumok tárolására szolgáló adathordozók egyrészt nagyon sérülékenyek, másrészt pedig gyorsan elhasználódnak, hiszen a CD-k, DVD-k, SSD-k és HDD-k gyárilag garantált élettartama 10 év körül van. Valamivel jobb a helyzet a mágnesszalagos háttértárolók esetében, azonban a papír élettartamához mérve még ez is csekélynek számít. A megőrzéssel kapcsolatos másik alapvető nehézség pedig az, hogy a szoftveres környezet folyamatosan fejlődik, vagyis az évtizedek vagy akár évszázadok múlva esetlegesen létező számítógépek már egészen biztosan nem fogják tudni felismerni a .jpg, vagy .doc kiterjesztésű fájlokat. Arra az érdekes paradoxonra, hogy az információhordozó és ezáltal a rajta rögzített információ élettartama úgy csökken, ahogy a múltból haladunk a jelenünk felé, Lem előző bekezdésben bemutatott, fiktív történészre is kitér:
„a korai neogén civilizációkról, Asszíria, Egyiptom, Görögország ősi kultúrájáról sokkal többet tudunk, mint az atomisztikát és a csillaghajózást megelőző korról. Ezek az archaikus kultúrák ugyanis maradandó emlékeket hagytak ránk, csontból, kőből, bronzból készült tárgyakat, míg a neogén középső és késői szakaszában minden ismeret és tudás megörökítésére az úgynevezett papír szolgált”.
És ehhez hozzátehetjük azt, hogy a papírt meghaladó, napjainkban használt mágneses és optikai jelhordozók még a papírnál is rosszabb élettartamot produkálnak, jóllehet a kőtáblákkal és papírokkal szemben megvan az az előnyük, hogy a rajtuk lévő információk rendkívül gyorsan terjeszthetők és reprodukálhatók. Fontosnak tartom kihangsúlyozni azt is, hogy az általunk megőrzésre érdemesnek tartott digitális objektumok papírra nyomtatása (amit sok esetben használnak a fontosabb e-mailek vagy nyilvántartások archiválására) csak átmeneti, 100-200 évnyi időre elegendő megoldást jelent, hiszen szerves anyagról lévén szó, minden papíralapú információhordozó megsemmisülésre van ítélve alkotóelemei, a cellulóz és a lignin savképződéssel járó bomlási folyamatai miatt.
Ha szeretnénk megérteni, hogy a különböző információhordozóinkon létező digitális jelek miként menthetők meg az utókor számára, akkor egy pillantást kell vetnünk a digitális objektumok materiális lenyomatára is. Hogy a merevlemez ezen a szinten legyen vizsgálható, ahhoz be kell lépnünk egy olyan tükörországba, ahol a tér és idő Kant-féle, többrétegű viszonyai milliomod méterekben (mikronokban) és ezredmásodpercekben (milliszekundumokban) mérhetők; a digitális beíródásnak ez az aktusa a vezető technológiai mérnöki tevékenység világa. A lemezre írás során az írófej elrendezi a jelhordozó felületén lévő mágneses részecskéket, majd, amikor az olvasófej előtt a jelhordozó mintegy 10.000 fordulat/másodperc sebességgel elmozdul, a mágneses részecskék polaritása alapján értelmezi az adatot nullának vagy egynek. A digitális térben létező adataink fizikai leképeződése a jelhordozón tehát nem több, mint egyszerű mágneses formája a bitnek: egy egyes vagy egy nulla, északi vagy déli polaritásban. Ezekből a nullákból és egyekből azután a digitális technika bármit felépíthet, ha megkapja hozzá a „szótárt” (vagyis a fájl kiterjesztését): képet, szöveget stb. Felhívnám a figyelmet a szavak szemantikájára: a lapon írunk, amivel szemben merevlemezre és mágnesszalagra írunk, ami a belsőségesség érzetét kelti. Amit a lapon írunk, azt látjuk, de az utóbbi kettő, mint egy zárt fedelű doboz, a szabad szem számára láthatatlanul tárolja a jeleket.
Amikor tehát azon gondolkodunk, hogy a közgyűjteményekben milyen eljárást érdemes alkalmazni a digitális objektumok megőrzésére, akkor alapvetően két dologra, a digitális jel és a digitális jel olvashatóságának (ami a hosszútávú megőrzésre alkalmas fájlformátumban tárolást jelenti) megőrzésére kell törekednünk.
A Rosetta Disk erős nagyítás alatt. A kép forrása: Long Now Rosetta Project
A digitális objektum közgyűjteményi archiválása
A közgyűjtemények homlokterében elsősorban a már digitálisan született („Born digital”) objektumok megőrzésének kérdése áll. A born digital objektumok típusaikat tekintve lehetnek szövegek, álló- és mozgóképek, hanganyagok, adatbázisok, adathalmazok, 3D-objektumok és a felsoroltak konténerei. (Forrás: https://ommik.hu/media/attachments/2019/12/09/fehr_knyv.pdf.) Látható tehát, hogy a born digital objektumok kezelésének egyik fő nehézsége azok heterogenitásából fakad, hiszen nagyon sokféle digitális objektumtípus lehetséges, amelyek archiválás szempontjából mind speciális igényekkel rendelkeznek, például az elavulás vagy az értelmezhetőség szempontjából. Természetesen nem a közgyűjteményi feladatokat ellátó intézmények szembesültek először a digitális objektumok hosszú távú megőrzésének kérdésével: a Consultative Committee for Space Data Systems (CCSDS) 1982-ben alakult, azoknak a nemzetközi űrügynökségeknek a fórumaként, amelyek érdekeltek voltak az űrkutatást támogató adatkezelési szabványok fejlesztésében. 1990-ben a CCSDS együttműködési megállapodást írt alá a Nemzetközi Szabványügyi Szervezettel (ISO). Az ISO kezdeményezésére kezdett hozzá a CCSDS az elektronikus iratok hosszú távú megőrzésével kapcsolatos szabvány kidolgozásához, amely kezdetben csak az űrkutatási projektek során keletkezett adatok megőrzését tekintette céljának. Hamarosan kiderült, hogy a szabvány messze túlmutat az űrügynökségek feladatain, a referenciamodell ugyanis általában fogalmazott meg kérdéseket az elektronikus információ hosszú távú megőrzésével kapcsolatban, túlmutatva a szakmai határokon. Az OAIS (Open Archival Information System) referenciamodellt 2001-ben véglegesítették, és azóta tekinthető egy olyan általános, magas szintű elméleti referenciamodellnek, amely minden szervezet, vállalat, kormány és tudományos intézmény számára alkalmazható rendszert biztosít a digitális adatok tárolására. (Forrás: https://mnl.gov.hu/mnl/szkk/szabvanyok.)
Borbély Szilárd asztali számítógépének alaplapja a PIM gyűjteményében
Mik azok a követelmények, amelyeket az OAIS-szabvány megfogalmaz egy hosszú távú megőrzést biztosítani képes archívum esetében? A modell olyan digitális objektumokat tároló repozitóriumokban gondolkodik, amelyek könyvtárakból, fájlokból és metaadatfájlokból állnak. Minden archiválandó digitális tárgyegyüttes esetén három csomagot ír elő, amelyek biztosítják a bennük tárolt információk hosszú távú megőrzését. Az említett három csomag közül az első az úgynevezett benyújtási adatcsomag (Submission Information Package – SIP) amely a digitális objektumokat azok eredeti, archiválás pillanatában lévő állapotában őrzi meg. A második csomag a SIP csomagból előállított archiválási adatcsomag (Archival Information Package – AIP), amely információtartalmát tekintve megegyezik a SIP-csomag tartalmával, azonban a digitális jel olvashatóságát (a fájl kiterjesztését) mindig az aktuális szoftverkönyezethez igazítja, a Library of Congress hosszú távú megőrzésre vonatkozó ajánlása alapján. Itt tehát a digitális objektumoknak az archiválást követő élete hasonló dinamikával rendelkezik, mint a „valódi”, fizikai térben létező tárgyak esetében: folyamatos megfigyelés alatt állnak, a revíziók során pedig megtörténik az AIP-csomagok korszerű, hosszú távú megőrzést lehetővé tevő formátumra konvertálása. Az utolsó, szolgáltatási adatcsomag (Dissemination Information Package – DIP) pedig a közgyűjtemények három alapfeladata közül a disszeminációval függ össze, vagyis az általunk őrzött műtárgyak, információk nyilvános közzétételével.
A Library of Congress ajánlása az e-mailek hosszú távú megőrzését biztosító formátumokra a 2022–2023-as évben. A kép forrása: https://www.loc.gov/preservation/resources/rfs/RFS%202022-2023.pdf
Az információk tárolására azonban nem csak a digitális megőrzés elméleti koncepcióját dolgozták ki. Más technológiai megoldások (nanofiche, nano engraving) hosszabb élettartamot (ultra-long term) ígérnek, de ezeken nem digitális jeleket, hanem nanotechnológiával rögzített, analóg adatokat tárolnak, amelyek erős nagyítással olvashatók. Ilyen technológiai megoldással dolgozik a Rosetta Disk, amelynek elméleti élettartama mintegy 10.000 év, vagy az Arch Mission Foundation, amely egymilliárd éves elméleti élettartamot biztosít. (Forrás: https://rosettaproject.org/, https://www.archmission.org/.)
The Arch Lunar Library. A kép forrása: Arch Mission Foundation
A digitális megőrzés további kérdései
A megfelelő adattárolási technológia kidolgozása mellett a múzeumoknak néhány további, elméleti kérdésre is választ kell találniuk. Ma már az írók sem hagyományos, postán küldött levelekkel kommunikálnak egymással, hanem csak úgy, mint bárki más, e-maileket és messenger üzeneteket küldenek egymásnak. Feladata-e egy múzeumnak, hogy megőrizze ezeket a már-már csetelést idéző kommunikációs formákat, és ha igen, akkor milyen módon? A múzeumok nagy becsben tartják az adott korszakok ismert embereinek, íróinak nem hivatalos, hétköznapi élettel összefüggő tevékenységét dokumentáló tárgyi emlékeit. Ma már ilyen dokumentációt leginkább a személyes üzenőfalakon, Facebook- és Instagram-felületeken találunk: mi lesz ezek megőrzésével? A kutatók számára szintén érdekes források azok a dokumentumok, amelyek egy mű elkészítésének fázisait rögzítik, a korai kéziratok, papírszélre vetett jegyzetek; napjainkra már ezek többsége is eltűnt, és a keletkezés verzióit a számítógépek merevlemezén található írás_1, írás_2 stb. nevet viselő fájlok tartalmazzák vagy az okostelefonok jegyzettömb alkalmazásai, kiegészítve minden ide gyűjtött, a mű megalkotásához szükséges információval. Ez azt jelenti vajon, hogy eljön az idő, amikor a muzeológusoknak már egy teljes számítógép archiválására kell felkészülni? A digitális forradalomból nem maradhatnak ki a hagyományos, szépművészeti jellegű, már a digitális térben született vizuális alkotások, valamint az NFT-k sem. Mihez tud kezdeni egy múzeum ezek megőrzésével? A digitális megőrzés területén sorakozó kérdéseket még hosszan lehetne sorolni, de egy biztos: izgalmas időszak elé néz a múzeumok szakmai közössége, ha válaszokat akar találni.
Horváth Dániel
A blogbejegyzés a PIM és az OSZK-DBK közös born digital archiválás projektjének tanulságai alapján készült.