Digitalizace historických fotografických materiálů

Tento text je již zastaralý. Aktuální verzi najdete na WIKI CiTEM jako Jan Hubička: Digitalizace historických fotografických materiálů na WiKI CiTEM.

Jan Hubička, honza@sechtl-vosecek.ucw.cz

Databáze

Pro správu digitalizovaných fotografií používáme vlastní databázi. Při návrhu databáze byl kladen důraz zejména na čitelnost dat v budoucnosti i možnosti práce bez přístupu ke všem zdigitalizovaným fotografiím naráz. Data jsou uložena ve standardním XML, které půjde zpracovat i kdyby se aktuální software pro správu databáze přestal používat.

Na rozdíl od mnoha databází na správu fotografií, nebylo pro uložení informace použito metadat původních souborů: informace lze uložit přímo do suborů s obrázky pomocí tzv. EXIF tagů. Problémem tohoto přístupu je, že data jsou k dispozici pouze spolu s fotografiemi a prostor pro uložení všech fotografií v plné kvalitě je značný a není praktické vyžadovat je všechny přístupné naráz.

Databáze používá zmenšené náhledy fotografií ve formátu standardního JPEG o šířce 1200 pixelů. Celá databáze i se zmenšenými náhledy obsahující cca 18000 fotografíí se tak vejde do prostoru 4GB. Náhledy jsou dále zmenšeny pro potřeby internetu do rozměru 480 pixelů po delší straně. Tato velikost byla zvolena jako kompromis mezi využitelností databáze a obavou z toho, že si lidé budou vypůjčovat fotografie z databáze bez dovolení pro různé účely.

Záznamy o fotografii

O každé fotografii udržujeme následující záznamy:
Materiál
Materiál fotografie včetně rozměrů u materiálů, kde je běžné mít jen několik málo rozměrů (u skleněných negativů a moderních filmů). Při zadavání se materiál vybere z roletkového menu, které je průběžně obnovováno o nové materiály podle potřeby.
Lakování
Skleněné negativy bývají lakovány. Tato informace je užitečná pro datování fotografií: většinou se lakovaly negativy jen před rokem 1900
Minimální a maximální rok vzniku
Rozmezí let, kdy mohla být fotografie pořízena. Do tohoto pole zadáváme datování buď podle popisku a nebo podle obsahu fotografie. U méně zjevných datování pak píšeme důvod datování do poznámek. Při automatickém zpracování fotografie ještě zůžit podle informací známých o využívání jednotlívých materiálů.
Vlastník a umístění
Do databáze přidáváme nejen fotografie uložené v našem archivu, ale i v oblastním archivu v Táboře a digitalizujeme i fotografie Šechtla a Vosečka zapůjčené se soukromých vlastnictví. Tyto pozitivy velmi zajímavě dokumentují vyžití fotografií, které se nám zachovaly převážně jen na negativech.
Kvalita
Hodnocení kvality fotografie ve stupnici od 1 do 5. Tato funkce vznikla jako výsledek původních diskuzí jestli zveřejňovat vše a nebo pouze kvalitní fotografie a jestli lepší fotografie v databázi upředňostňovat. Postupem času tato funkce přestala být používána a určuje pouze řazení fotografií v jednotlivých kategoriích.
Autor fotografie
Autor fotografie pokud je prokazatelně známý
Český a anglický název
Krátký název fotografie. Anglický název vyplňujeme jen u fotografií, které byly vystaveny a kde názvy byly přeloženy. V ostatních případech se cizojazyční zájemci musí spokojit se strojovým překladem klíčových slov.
Český a anglický popis
Delší popis fotografie. Zde uvádíme původní popisky i nově zjištěné informace včetně zdrojů. Jedna z chyb naší databáze je, že původní údaje od nových nejsou nijak jednoznačně oddělena
Texty na fotografii
Aby bylo možné prohledávání, zde se snažíme opisovat veškeré texty objevující se na fotografii, jako například názvy obchodů a pod. Toto pole neobsahuje texty napsané přímo na negativu tuží mimo obrazovou část a nebo poznámky na přebalových papírech, které patří do sekce popis.
Poznámky
Poznámky nejsou zveřejňovány a obsahují například záznam o změnách a další informace které z nějakých důvodů nechceme zveřejnit
Kategorie
Seznam kategorií, do kterých fotografie patří
Klíčová slova
Původní představa byla v tomto políčku uvádět informace o objektech na fotografii v prvním pádě jednotného čísla. Ke klíčovým slovům existuje slovník který umožňuje překlad do angličtiny i lepší kontrolu chyb. Bohužel se nepodařilo udržet konzistentní kvalitu a často klíčová slova obsahují jen kopii názvu a různě skloněná slova a seznamy jsou velmi neúplné. V budoucnu však doufáme, že se podaří situaci zlepšit. Klíčová slova se take automaticky doplnují podle kategorií: například kategorie portréty mužů doplní automaticky klíčová slova „portret“ a „muž“

Vyhledávání v databázi

Databáze je organizována do stromové struktury kategorií podobné jako u webových katalogů typu Yahoo a nebo Seznam. Dále lze databázi prohlížet podle let, uložení originálů, materiálů, čísla zakázky. Prohledávání podle klíčových slov nebylo implementováno, ale internetové vyhledávače (např. google) jej poskytují uspokojivě.

Organizace stromu kategorí

Strom kategorií dělí fotografie podle obsahu i formy. Jedna fotografie může být obsažena v několika kategoriích a kategorie můžou obsahovat odkazy na související podkategorie jiných částí stromu.

Vlastní strom vznikl postupným vývojem a jednotlivé kategorie byly zakládány z nejrůznějších důvodů a ktegorie, kde možství snímků přesáhlo rozumnou míru byly podrozdělovány

Mezi základní dělení patří dělení podle formy:

Události
Fotografie nejrůznějších události do množství 3 snímku z jedné akce
Reportáže
Větší reportážní celky (více než 3 snímky)
Portréty a postavy
Portrétní fotografie v atelieru i v exterieru kde jsou maximálně dvě osoby
Skupinové fotografie
Skupiny obsahující 3 a více osob.
Tabla
Města a vesnice, Hrady a zámky, Cizina, Kláštery, Interiery,Krajiny
Místopisné fotografie.
Technika,Koně a kočáry,při práci
Místopisné fotografie.
Další kategorie mají spíše společenský význam:
Kluby a spolky
Kultura
Osobnosti
Fotografie týkající se známých osobností (například Edvarda Beneše či jiných osobností portrétovaných v atelieru). Jedná se nejen o fotografie osobností ale i věcí s nimi spojených, například interiery vily Edvarda Beneše či reportáž z jeho návštěvy Tábora
firma Šechtl a Voseček
Rodiny
Pokud se podaří dohledat fotografie týkající se jedné rodiny - například z rodiného alba, tyto kategorie sdružují skupinové fotografie, portréty ale i vše další co se dané rodiny týká. Například fotografie nemovitostí.
Šlechta
Podobný význam jako u rodin
Umělecké fotografie
Reklama

Nakonec byly založeny kategorie pro některé méně obvyklé techniky. Například ušlechtilé tisky, rentgenové fotografie, stereoskopické fotografie, autchromy.

Výsledkem tohoto poněkud nekoncepčního vývoje je, že každý uživatel stromu kategorií potřebuje trochu času si na systém zvyknout. Strom kategorií však představuje zcela nejvyužívanější metodu hledání fotografí v archivu a je užitečný zejména pro ty, co nevědí přesně co hledají a pouze se chtějí s archivem seznámit.

Vlastní strom lze snadno modifikovat a proto dnes s kvalitnější představou o tématickém členění archivu je snadné jej přeorganizovat v přehlednější pomůcku.

Automatické kontroly konzistence údajů zadaných do databáze

Databáze automaticky kontroluje některé informace. Datování je ověřováno s čísly zakázek: informace o číslování zakázek bylo sice ztraceno, ale podle několika fotografií s přesným datováním i číslem bylo určeno přibližné přiřazení čísel jednotlivým rokům. Podle tohoto přiřazení se fotografie kontrolují a pokud jejich datování neodpovídá číslu je opraveno buď datum, číslo a nebo vlastní algoritmus pro aproximaci. U nedatovaných fotografií je také určení roku podle čísla vypisováno takto: Nejbližší starší datovaná má číslo 1 a je z roku 1907. Nejbližší mladší datovaná má číslo 288 a je z roku 1908. Tato fotografie tedy bude přibližně z roku 1908..

Další kontrola probíhá podle stromu kategorií. Napřílad kategorie „portréty T. G. Masaryka“ má nastavený maximální rozsah podle jeho narození a úmrtí. Pokud datování fotografie nespadá do tohoto intervalu, je označeno za chybné. Je možné v tomto pravidlu dělat výjímky: například portrét T. G. Masaryka na výstavě uspořádané po jeho smrti je správně datován do pozdějšího data.

Klíčová slova jsou kontrolována podle slovíku, který je průběžně doplnován podle potřeby.

Správa upravených fotografií

Fotografie pro tisk jsou upravovány z půvdních RAW scanů. Protože se jedná o náročnou proceduru, jednotlivé upravené a vyretušované fotografie archivujeme a vkládáme do databáze, kde se zobrazují jako alternativní verze obrázku. Pomocí této funkce lze do databáze vložit také zajímavé detaily, skeny zadních stran fotografií a další podobné informace.

Správa archivace

Do databáze také vkládáme informace o jednotlivých archivních médiích tak jak jsou vytvářeny a případně ničeny. Jednoduchý nástroj kontroluje, že všechny zálohované soubory by měly existovat ve 3 kopiích a že jsme nezapoměli některé naskenované fotografie do databáze zařadit.

Autor: , Google +