,

Myter og misforståelser om langtidslagring av data

Over en rykende fersk morgenkaffe snakker jeg med CTO & Founder Terje Bakken om påstandene rundt langtidslagring av data. I flere artikler sås det tvil om vi i fremtiden kan lese data i ulike digitale filformater.

Terje Bakken er sivilingeniør i datateknikk, med en Master of Science fra NTNU.

– Påstandene går på at det største problemet med arkivering i fremtiden blir å tolke gamle filformater. Dette blir stadig gjentatt i media. Denne påstanden er jeg faglig uenig i, sier Terje.

Med tolking av filformater menes hvorvidt innhold lagret i ulike digitale dokumentformater er lesbare noen tiår eller enda lenger fram i tid.

Han utdyper videre.  –Det dukker stadig opp artikler om dokument- og bildeformater med begrenset levetid. Dette leder folk til å tro at man bør skrive ut og arkivere på papir.

-Hva er din kommentar til det?

– Alle populære dokumentformater i bruk i dag vil kunne bli tolket i uoverskuelig fremtid. Verden kommer ikke til å stoppe opp og slutte å forstå formater som JPG eller PDF. Det samme går for de fleste av dagens populære filformater. Derimot kan jeg forstå bekymringen når det gjelder sære databaser og proprietære formater som 3D tegninger (uten stor utbredelse), men da må selvfølgelig programvaren som bearbeider innholdet også arkiveres og kunne emuleres i fri software uten lisenskrav.

– Det å si at papir er et såkalt «tålmodig medium» i denne sammenhengen er å sammenlikne helt forskjellige ting, slår han fast. Informasjon på papir har selvfølgelig uendelig mye dårligere bruksverdi enn digital informasjon, sier Terje Bakken.

Uttrykket «tålmodig medium» stammer fra en referanse om Arkivverket som har en paverull fra 1189 som er i fin stand, mens de første digitale uttrekkene fra rundt 1980 er til dels ganske vanskelige å tolke i dag.

Om GDPR og sletting

– Terje, du har uttalt at sletting er det mest kostbare med arkivering og lagring generelt. Dette leder meg til å stille spørsmålet: Hva skjer når en blogger angrer og krever at informasjonen slettes? Hvor går grensen for eksempelvis offentlige Facebook profiler og lukkede forum?

– Det var lettere før når ting kom på trykk i avisen. Når tekst sto på trykk, forsto alle at det var for sent å slette. På Internett er ting mer flyktig og man er i den tro at data kan slettes fordi det alltid må hentes fra et sted (Webserver, Facebook etc.), svarer Terje.

– Samtidig er det et stort og økende samfunnsproblem at servere og løsninger til slutt forsvinner, og at alle hyperlenker dør en dag. Den dagen Facebook tar veien Myspace og GeoCities har gått, vil alt som er av interesse for ettertiden i utgangspunktet bli utilgjengelig, sier han.

– Hva er løsningen?

– Løsningen på sikt er at informasjon publiseres uavhengig av server, utgiver eller system. Da er man garantert at informasjonen er tilgjengelig så lenge det finnes interesse for den. På lang sikt må verden bevege seg i retning av å akseptere at data som er lagt ut offentlig, sendt eller lagret generelt – ikke kan kreves slettet, og at ikke nødvendigvis en enkeltaktør har et tilbakevirkende redaktøransvar for alt som er tilgjengelig av informasjon for vedkommende.

Det er bruk og handlinger som må reguleres, ikke den tekniske lagringen. Ingen kan beordre min hjerne til å glemme noe jeg har erfart og det samme prinsippet må, når verden finner ut at GDPR ser fint på papiret men i mange tilfeller umulig å etterleve i praksis, til slutt også gjelde for programvare.

– Teknisk sett snakker jeg om på lang sikt å gå over fra dagens server-adressering til innholds-adressering. Når du skal hente informasjon fra Internett i dag må du som regel først kontakte serveren som har publisert informasjonen og be om den, på dens premisser. Alle linker på web forteller hvor informasjonen skal hentes fra. Dette er en enkel modell å forstå, men har en del innebygde svakheter som at linken til informasjonen bare fungerer så lenge den som har publisert det fortsatt er tilgjengelig og villig til å gi den ut, og at alle må hente hver sin kopi av den samme informasjonen fra det samme stedet.

En teknisk mer elegant løsning er å ha linker som er uløselig knyttet opp til selve innholdet og der man kan dra nytte av at informasjonen allerede kan finnes nær konsumenten og leveres av andre i nettverket, uavhengig av server som opprinnelig publiserte informasjonen ikke er tilgjengelig. Det finnes initiativ i startgropen som prøver ut dette konseptet, som https://ipfs.io.

– Hva med opphavsrett?

– Opphavsrett er naturligvis en annen utfordring med lagring, men mye informasjon av allmenn interesse burde heller ikke være omfattet av opphavsrett. For meg er det uforståelig at Norges innbyggere ikke har gratis tilgang til rettskraftige dommer som er essensielt for å sette seg inn i gjeldende lov og rett, men må kjøpe dyr tilgang gjennom en privat stiftelse, Lovdata.no.

Håkon Wium-Lie (Internett-pioner og oppfinner av CSS-standarden) som har vært med på et initiativ (https://rettspraksis.no) for å legge dommer offentlig, tapte nå sist i tingretten da de ble saksøkt av Lovdata.

Saken er anket 19.10.2018 og forhåpentligvis kommer samfunnet til fornuft i den saken, avslutter Terje Bakken

—-ooo—

Partner på kommunikasjon og strategi Berit Bjerknes i samtale CTO i Terki Software, Terje Bakken