Digitalizace historických fotografických materiálů
Jan Hubička, honza@sechtl-vosecek.ucw.cz
- Volba hardware k digitalizaci
- V jaké kvalitě digitalizovat
- Základní postup digitalizace
- Tisk fotografií z digitálních předloh
- Databáze pro správu fotografií
- Zpřístupnění archivu
- Uložení a archivace digitálních dat
Databáze
Pro správu digitalizovaných fotografií používáme vlastní databázi. Při návrhu databáze byl kladen důraz zejména na čitelnost dat v budoucnosti i možnosti práce bez přístupu ke všem zdigitalizovaným fotografiím naráz. Data jsou uložena ve standardním XML, které půjde zpracovat i kdyby se aktuální software pro správu databáze přestal používat.
Na rozdíl od mnoha databází na správu fotografií, nebylo pro uložení informace použito metadat původních souborů: informace lze uložit přímo do suborů s obrázky pomocí tzv. EXIF tagů. Problémem tohoto přístupu je, že data jsou k dispozici pouze spolu s fotografiemi a prostor pro uložení všech fotografií v plné kvalitě je značný a není praktické vyžadovat je všechny přístupné naráz.
Databáze používá zmenšené náhledy fotografií ve formátu standardního JPEG o šířce 1200 pixelů. Celá databáze i se zmenšenými náhledy obsahující cca 18000 fotografíí se tak vejde do prostoru 4GB. Náhledy jsou dále zmenšeny pro potřeby internetu do rozměru 480 pixelů po delší straně. Tato velikost byla zvolena jako kompromis mezi využitelností databáze a obavou z toho, že si lidé budou vypůjčovat fotografie z databáze bez dovolení pro různé účely.
Záznamy o fotografii
- Materiál
- Materiál fotografie včetně rozměrů u materiálů, kde je běžné mít jen několik málo rozměrů (u skleněných negativů a moderních filmů). Při zadavání se materiál vybere z roletkového menu, které je průběžně obnovováno o nové materiály podle potřeby.
- Lakování
- Skleněné negativy bývají lakovány. Tato informace je užitečná pro datování fotografií: většinou se lakovaly negativy jen před rokem 1900
- Minimální a maximální rok vzniku
- Rozmezí let, kdy mohla být fotografie pořízena. Do tohoto pole zadáváme datování buď podle popisku a nebo podle obsahu fotografie. U méně zjevných datování pak píšeme důvod datování do poznámek. Při automatickém zpracování fotografie ještě zůžit podle informací známých o využívání jednotlívých materiálů.
- Vlastník a umístění
- Do databáze přidáváme nejen fotografie uložené v našem archivu, ale i v oblastním archivu v Táboře a digitalizujeme i fotografie Šechtla a Vosečka zapůjčené se soukromých vlastnictví. Tyto pozitivy velmi zajímavě dokumentují vyžití fotografií, které se nám zachovaly převážně jen na negativech.
- Kvalita
- Hodnocení kvality fotografie ve stupnici od 1 do 5. Tato funkce vznikla jako výsledek původních diskuzí jestli zveřejňovat vše a nebo pouze kvalitní fotografie a jestli lepší fotografie v databázi upředňostňovat. Postupem času tato funkce přestala být používána a určuje pouze řazení fotografií v jednotlivých kategoriích.
- Autor fotografie
- Autor fotografie pokud je prokazatelně známý
- Český a anglický název
- Krátký název fotografie. Anglický název vyplňujeme jen u fotografií, které byly vystaveny a kde názvy byly přeloženy. V ostatních případech se cizojazyční zájemci musí spokojit se strojovým překladem klíčových slov.
- Český a anglický popis
- Delší popis fotografie. Zde uvádíme původní popisky i nově zjištěné informace včetně zdrojů. Jedna z chyb naší databáze je, že původní údaje od nových nejsou nijak jednoznačně oddělena
- Texty na fotografii
- Aby bylo možné prohledávání, zde se snažíme opisovat veškeré texty objevující se na fotografii, jako například názvy obchodů a pod. Toto pole neobsahuje texty napsané přímo na negativu tuží mimo obrazovou část a nebo poznámky na přebalových papírech, které patří do sekce popis.
- Poznámky
- Poznámky nejsou zveřejňovány a obsahují například záznam o změnách a další informace které z nějakých důvodů nechceme zveřejnit
- Kategorie
- Seznam kategorií, do kterých fotografie patří
- Klíčová slova
- Původní představa byla v tomto políčku uvádět informace o objektech na fotografii v prvním pádě jednotného čísla. Ke klíčovým slovům existuje slovník který umožňuje překlad do angličtiny i lepší kontrolu chyb. Bohužel se nepodařilo udržet konzistentní kvalitu a často klíčová slova obsahují jen kopii názvu a různě skloněná slova a seznamy jsou velmi neúplné. V budoucnu však doufáme, že se podaří situaci zlepšit. Klíčová slova se take automaticky doplnují podle kategorií: například kategorie portréty mužů doplní automaticky klíčová slova „portret“ a „muž“
Vyhledávání v databázi
Databáze je organizována do stromové struktury kategorií podobné jako u webových katalogů typu Yahoo a nebo Seznam. Dále lze databázi prohlížet podle let, uložení originálů, materiálů, čísla zakázky. Prohledávání podle klíčových slov nebylo implementováno, ale internetové vyhledávače (např. google) jej poskytují uspokojivě.
Organizace stromu kategorí
Strom kategorií dělí fotografie podle obsahu i formy. Jedna fotografie může být obsažena v několika kategoriích a kategorie můžou obsahovat odkazy na související podkategorie jiných částí stromu.
Vlastní strom vznikl postupným vývojem a jednotlivé kategorie byly zakládány z nejrůznějších důvodů a ktegorie, kde možství snímků přesáhlo rozumnou míru byly podrozdělovány
Mezi základní dělení patří dělení podle formy:
- Události
- Fotografie nejrůznějších události do množství 3 snímku z jedné akce
- Reportáže
- Větší reportážní celky (více než 3 snímky)
- Portréty a postavy
- Portrétní fotografie v atelieru i v exterieru kde jsou maximálně dvě osoby
- Skupinové fotografie
- Skupiny obsahující 3 a více osob.
- Tabla
- Města a vesnice, Hrady a zámky, Cizina, Kláštery, Interiery,Krajiny
- Místopisné fotografie.
- Technika,Koně a kočáry,při práci
- Místopisné fotografie.
- Kluby a spolky
- Kultura
- Osobnosti
- Fotografie týkající se známých osobností (například Edvarda Beneše či jiných osobností portrétovaných v atelieru). Jedná se nejen o fotografie osobností ale i věcí s nimi spojených, například interiery vily Edvarda Beneše či reportáž z jeho návštěvy Tábora
- firma Šechtl a Voseček
- Rodiny
- Pokud se podaří dohledat fotografie týkající se jedné rodiny - například z rodiného alba, tyto kategorie sdružují skupinové fotografie, portréty ale i vše další co se dané rodiny týká. Například fotografie nemovitostí.
- Šlechta
- Podobný význam jako u rodin
- Umělecké fotografie
- Reklama
Nakonec byly založeny kategorie pro některé méně obvyklé techniky. Například ušlechtilé tisky, rentgenové fotografie, stereoskopické fotografie, autchromy.
Výsledkem tohoto poněkud nekoncepčního vývoje je, že každý uživatel stromu kategorií potřebuje trochu času si na systém zvyknout. Strom kategorií však představuje zcela nejvyužívanější metodu hledání fotografí v archivu a je užitečný zejména pro ty, co nevědí přesně co hledají a pouze se chtějí s archivem seznámit.
Vlastní strom lze snadno modifikovat a proto dnes s kvalitnější představou o tématickém členění archivu je snadné jej přeorganizovat v přehlednější pomůcku.
Automatické kontroly konzistence údajů zadaných do databáze
Databáze automaticky kontroluje některé informace. Datování je ověřováno s čísly zakázek: informace o číslování zakázek bylo sice ztraceno, ale podle několika fotografií s přesným datováním i číslem bylo určeno přibližné přiřazení čísel jednotlivým rokům. Podle tohoto přiřazení se fotografie kontrolují a pokud jejich datování neodpovídá číslu je opraveno buď datum, číslo a nebo vlastní algoritmus pro aproximaci. U nedatovaných fotografií je také určení roku podle čísla vypisováno takto: Nejbližší starší datovaná má číslo 1 a je z roku 1907. Nejbližší mladší datovaná má číslo 288 a je z roku 1908. Tato fotografie tedy bude přibližně z roku 1908..
Další kontrola probíhá podle stromu kategorií. Napřílad kategorie „portréty T. G. Masaryka“ má nastavený maximální rozsah podle jeho narození a úmrtí. Pokud datování fotografie nespadá do tohoto intervalu, je označeno za chybné. Je možné v tomto pravidlu dělat výjímky: například portrét T. G. Masaryka na výstavě uspořádané po jeho smrti je správně datován do pozdějšího data.
Klíčová slova jsou kontrolována podle slovíku, který je průběžně doplnován podle potřeby.
Fotografie pro tisk jsou upravovány z půvdních RAW scanů. Protože se jedná o náročnou proceduru, jednotlivé upravené a vyretušované fotografie archivujeme a vkládáme do databáze, kde se zobrazují jako alternativní verze obrázku. Pomocí této funkce lze do databáze vložit také zajímavé detaily, skeny zadních stran fotografií a další podobné informace.
Do databáze také vkládáme informace o jednotlivých archivních médiích tak jak jsou vytvářeny a případně ničeny. Jednoduchý nástroj kontroluje, že všechny zálohované soubory by měly existovat ve 3 kopiích a že jsme nezapoměli některé naskenované fotografie do databáze zařadit.