Digitalizace historických fotografických materiálů

Tento text je již zastaralý. Aktuální verzi najdete na WIKI CiTEM jako Jan Hubička: Digitalizace historických fotografických materiálů na WiKI CiTEM.

Jan Hubička, honza@sechtl-vosecek.ucw.cz

Uložení a archivace digitálních dat

Problémy spojené z dlouhodobou archivací digitálních dat jsou velmi často diskutovaným problémem. Praxe ukazuje, že většina digitálních dat pořízená před 20ti lety je dnes nepoužitelná. K tomu přispívá několik faktorů:

Nízká životnost digitálních médií.
Životnost dnes běžně používáných CD a DVD se pohybuje řádově v jednotkách až desítkách let podle kvality média a jeho uložení.
Nízká morální životnost médií.
Data uložená před 20ti lety na 8mi bitovém počítači na kazetu Emgeton jsou dnes jen těžko použitelná prostě proto, že zařízení potřebné pro jejich přečtení se již dlouho nepoužívá.
Nízká morální životnost digitálních formátů.
Softwarové vybavení počítačů se stále vyvíjí rychlým tempem. Formáty digitálních dat stále vznikají a nahrazují staré. Data uložená před 20ti lety tedy mají velkou šanci být ve formátu, jehož přečtení a převedení do formátu dnes používaném je velmi náročné

Z těchto problému lze snadno vyvodit, že archivace digitálních dat je předem prohranou záležitostí a nemá smysl se o ni vůbec pokoušet. Tento závěr je jen z části pravdivý. Nelze sice předpokládat, že za 100 let budou data dnes uložená na CD, DVD či disky čitelná a použitelná, hlavní výhodou digitálních dat je možnost bezztrátové duplikace.

Podle moorova zákonu se nároky na uložení konstantního množství digitláních dat přibližně spoloviční každý rok. Zatímco tedy archivace analogových materiálů (skleněných negativů a filmů) se stává rok od roku náročnější a jejich životnost nelze prodlužovat donekonečna, digitální data bude vždy možne kopírovat a pokud nenastane konec digitální doby, budou se nároky na kopírování do budoucna snižovat. Pravidelne kopírování dat řeší problemy s nízkou životností medií.

Morální životnost digitálních formátů

Při volbě digitálních formátů je dobré se držet zásady používat pouze formáty, které nejsou závislé na jednom výrobci. Dobře dokumentované, široce používané a nejsou zatíženy patenty formáty (otevřené formáty) mají větší šanci přežít. Navíc je vhodné používat pouze formáty, které lze snadno převést na jiný formát. Bežné formáty na uložení obrázků (TIFF, JPEG apod.) jsou z tohoto pohledu velmi vhodné, protože jsou již mezi námi několik let a navíc existují tisíce nástrojů pro práci s nimi.

Z formátů dnes běžných pro práci s obrázky lze doporučit formát TIFF, který umožňuje uložení 16ti bytových dat bez ztráty kvality. Navíc umožňuje uložení množství metadat o technických detailech pořízení fotografie. Často je doporučováno pro archivaci nepoužívat možnosti komprese formátu TIFF. Kompresi JPEG opravdu nelze doporučit: je omezena na 8 bitů na kanál a svou kvalitou je dnes již překonaná. Komprese LZW a ZIP jsou však bezztrátové a přiliš škodlivé nejsou: není problém data převést do nekompresovaných identických jako před kompresí.

Běžné grafické formáty ale mají nevýhodu, že ztrácí informaci o použitém digitálním zařízení: při převodu zdigitalizovaných dat do obrázku se provádí úpravy, které vedou ke ztrátě informace. Z tohoto důvodu byly vyvinuty různé formáty RAW, které umožňují provést převod do pixelového formátu podle potřeby. Tyto formáty sice odstraňují ze strátou informace, ale jsou typickým příkladem formátu, který bude brzy v budoucnu překonán a stane se zastaralým.

Program vuescan nabízí zajímavé řešení: ukládání RAW dat přímo do souborů TIF (v programu uznačených jako RAW TIF). Tyto soubory lze snadno zpracovávat buď vuescanem a nebo běžnými programy pro práci z obrázky. Toto je možné u skenerů, které narozdíl od dnes běžnýc digitálních fotoaparátů snímají kompletní barevnou informaci v každém pixelu. Převod do obrázku je tedy mnohem přímočařejší, než v případě digitálního fotoaparátu

Další zajímavou alternativou je formát DNG, který je snahou firmy Adobe řešit problém s explozí nejrůznějších RAW formátů. Tento formát umožňuje uložení RAW dat ve formě nezávislé na digitálním fotoaparátu a program Vuescan obsahuje také možnost exportu do formátu DNG z množství běžných skenerů. Tento formát je ale sále poněkud mladým a jen budoucnost ukáže do jaké míry budou data uložená ve starých DNG čitelná, ale je rozhodně vhodnější alternativou, než klasické RAW formáty.

JPEG2000

JPEG2000 patří k nejmodernějším formátům pro práci s digitálními fotografiemi. Jedná se o dobře zdokumentovaný mezinárodní standard. Umožňuje jak bezztrátovou kompresi podobnou formátu TIFF, zde ale dosahuje přibližně o třetinu až polovinu lepšího kompresního poměru, tak ztrátovou kompresi pomocí waveletů.

JPEG2000 byl také navržen pro práci s daty ve velkém rozlišení. Je organizován tak, že získání souboru v menším rozlišení potřebuje jen počátek souboru. Je tedy rychlejší při práci v nízkém rozlišení než běžné TIFF soubory, které potřebují čas pro úplné načtení a také je odolnější vůči chybám - pokud je poškozen, zůstane alespoň obraz v nižší kvalitě.

Ztrátová komprese JPEG2000 dosahuje výborných kompresních poměrů s velmi malým množstvím artefaktů. Jedná se hlavně o ztrátu digitálního šumu při větší kompresi zrna fotografie. Ani tak ale nelze použití ztrátové komprese příliš doporučit: je zjevné, že vývoj v této oblasti se příliš neustálil a v budoucnosti bude notné převést do nového formátu. Pokud i ten bude ztrátový, dojde k dvojité ztrátě kvality. Navíc není úplně jasné jak detailní analýzy získaných dat budou v budoucnu zajímavé a jestli ztráta šumu a zrna není podstatná. V našem projektu ale používáme ztrátovou kompresi JPEG2000 k uložení všech dalších souborů vyjma primárních skenů (fotografií upravených pro tisk apod).

Author: , Google +