Universiteit werkt aan emulatie-infrastructuur voor oude bestandsformaten

pure-imac-1243106

Project wil oude files toegankelijk houden 

Soms is het slechts onhandig. Maar in andere gevallen spelen ook compliance en governance een belangrijke rol. Oude bestandsformaten worden lang niet altijd meer door softwarebedrijven ondersteund. Waardoor het ontsluiten van de gegevens en de informatie die hierin vast ligt erg lastig kan worden. Een project van de Amerikaanse Yale-universiteit probeert hier nu in de vorm van een zeer omvangrijke emulatie-infrastructuur een oplossing voor te ontwikkelen. 

Veel bedrijven en overheidsinstellingen worstelen er mee: oude bestandsformaten die niet langer wordt ondersteund door het softwarebedrijf dat dit format heeft ontwikkeld. Dit probleem doet zich voor bij vrijwel ieder type bestand. Of we het nu hebben over tekstbestanden, spreadsheets, foto’s of formaten waarmee door technische software bijvoorbeeld meetdata wordt vastgelegd. In al deze gevallen komt er onherroepelijk een moment waarop het file format de status ‘end of life’ krijgt.

Meerdere opties

Is dit eenmaal het geval, dan resteert er voor de IT-afdelingen die hiermee worden geconfronteerd nog maar een handvol opties.

De eerste is alle bestanden converteren naar een (nog) wel courante bestandsstructuur. Dit is in veel gevallen echter hooguit een theoretische oplossing. Veel bedrijven en overheden hebben echter vele terabytes of meer aan data staan. Sommige data is live, andere is gearchiveerd. Actief in gebruik zijnde bestanden kunnen wellicht nog wel worden omgezet naar een nieuwer format, maar bij archiefdata wordt dit een enorme operatie. Met alle kosten en tijdsinspanning van dien.

Open source

Een tweede oplossing is op zoek gaan naar een open source-variant voor de applicatiesoftware waarmee de bestanden zijn aangemaakt. Soms zijn dit soort projecten inderdaad actief. Bij veel op open source gebaseerde alternatieven zien we echter dat de ondersteuning van een bestandsformaat weliswaar voor 90 of 95 procent goed gaat, maar dat net die laatste paar procenten tot problemen kunnen leiden.

Wie bijvoorbeeld grote hoeveelheden tekstdocumenten heeft staan waarin bepaalde vendor-specifieke lettertypes zijn gebruikt, kan zomaar tot de ontdekking komen dat deze fonts niet beschikbaar zijn via de open source-applicatie. Het openen van een bestand lukt dan wellicht wel, maar de software zal bij het ontbreken van het juiste font een alternatief lettertype suggereren. En dat kan leiden tot allerlei ongewenste afwijkingen in bijvoorbeeld de opmaak of de structuur van het document. Natuurlijk kan er dan gezocht worden naar een wél redelijk passend lettertype, maar in de praktijk zal dit zelden tot een 100 procent correcte oplossing leiden.

Complete systeemomgeving

floppy-disk-mac-windows-98-1521362-300x225 Ook is het mogelijk om de complete systeemomgeving waarmee de bestanden oorspronkelijk zijn aangemaakt en opgeslagen - zeg maar - ‘in leven’ te houden. Met andere woorden: de IT-afdeling archiveert in zo’n situatie niet alleen bestanden, maar zorgt er ook voor dat de hardware en de software waarmee de bestanden zijn gecreëerd beschikbaar blijft. Dit is een aanpak die in het verleden door bijvoorbeeld fabrikanten van vliegtuigen werd gevolgd. Zelfs als er nog maar één vliegtuig van een bepaald type rondvloog, bleef deze compleet systeemomgeving operationeel.

De kosten van een dergelijke aanpak zijn echter enorm. Bovendien is het maar de vraag of het inderdaad lukt om zowel de hardware als de software operationeel te houden. Let wel, het gaat vaak om applicaties, systeemsoftware en bijvoorbeeld middleware, database-omgevingen, besturingssystemen, netwerksoftware, drivers, dll’s, noem maar op. Deze programmatuur dient volledig functioneel te blijven op hardware waarvoor bij storingen almaar minder componenten beschikbaar zijn. Terwijl voor de software uiteraard ook geen ondersteuning meer bestaat. Eventuele bugs of andere fouten worden er niet meer uitgehaald, waardoor de programmatuur ook nog eens onveilig of misschien zelfs wel gevaarlijk wordt om te gebruiken.

Via-via oplossen

Natuurlijk is er ook nog de mogelijkheid om in voorkomende gevallen via het informele circuit externe expertise in te schakelen. Dat zal ongetwijfeld succes opleveren in bepaalde specifieke gevallen, maar wie met regelmaat oude data wil kunnen opvragen zal hierin geen structurele oplossing herkennen.

hoofdfoto

Wellicht zijn er nog meer opties voor IT-afdelingen die oude bestanden toegankelijk willen gehouden. Maar het zal duidelijk zijn dat dit arbeidsintensieve en kostbare projecten opleveren, zonder dat succes ook daadwerkelijk gegarandeerd is.

Emulatie-infrastructuur

Aan de universiteit van Yale heeft men dit probleem ook onderkend. Daarom wordt hier gewerkt aan technologie die wellicht wél een oplossing kan bieden. In feite probeert men hier als het ware een historisch computermuseum in software na te bouwen. Op basis van virtualisatie kan dan vervolgens een zeer groot aantal VM’s worden gecreëerd waarin incourante software wordt geïnstalleerd. Het gaat daarbij dus om enerzijds systeemomgevingen - denk aan Windows 98 of Windows NT - en anderzijds een zeer uitgebreid bibliotheek met geëmuleerde applicatiesoftware.

Opkoopprogramma

Om dit te kunnen realiseren, koopt de onderzoeksgroep van de universiteit al een aantal jaren oude computers op. Deze oude systemen worden vervolgens geheel opgeschoond. Hierdoor staat alleen een zo origineel mogelijke versie van het operating system op de computer. Vervolgens maken de onderzoekers een ‘image’ van de harde schijf, zodat deze in een VM kan worden opgenomen. Op deze manier zijn inmiddels ook duizenden cd-rom’s gekopieerd, variërend van games tot zakelijke applicaties.

Mag dit wel?

De vraag is natuurlijk wel wat de juridische gevolgen hiervan zijn. Gaan softwarebedrijven akkoord met deze manier van werken? Het gaat immers om een verlenging van de levensduur van oude software. Die programmatuur heeft men destijds natuurlijk niet voor niets ‘end of life’ verklaard. Soms zal dat om technische redenen zijn geweest. In andere gevallen zullen er ook commerciële argumenten hebben meegespeeld.

Daar staat echter tegenover dat dit onderzoeksproject ook als een interessante ondersteuning kan worden gezien voor bepaalde typen software en dus bepaalde softwarefirma’s. Een leverancier kan naar dit project verwijzen als een - zeg maar - service naar klanten die nog stokoude bestanden hebben staan die nu plotsklaps gebruikt moeten worden. Maar om welke software gaat het dan? En welke firma’s zien hierin inderdaad een vorm van serviceverlening en willen hieraan meewerken? Het zijn allemaal vragen die nog lang niet beantwoord zijn.

Dossiers