Digitalizace historických fotografických materiálů

Tento text je již zastaralý. Aktuální verzi najdete na WIKI CiTEM jako Jan Hubička: Digitalizace historických fotografických materiálů na WiKI CiTEM.

Jan Hubička, honza@sechtl-vosecek.ucw.cz

Zpřístupnění archivu

Celý archiv byl zpřístupněn na internetu v náhledovém rozlišení (640 pixelů po delší straně) na WWW stránkách projektu http://sechtl-vosecek.ucw.cz/. Naštěstí v našem případě nebylo nutné řešit komplikované otázky autorských práv, které často komplikují zveřejnění dalších archivů. Uveďme jen, že mnohé ze zahraničních institucí nechávají rozhodnutí o autorských právech a copyrigtu na zájemcích o použití fotografie s archivu: http://www.loc.gov/rr/print/195_copr.html.

Přístupnost webovým vyhledávačům

Podstatné pro dostupnost archivu je jeho přístupnost webovým prohledávačům typu google. Tyto prohledávače automaticky prochází stránky a je nutné, aby jednoslivé stránky s fotografiemi byly jednak přístupné (nebyl v cestě přihlašovací dialog) a také robot dokázal spojit informace - klíčová slova a popis s vlastní fotografií.

Mnoho webových databází tento krok podceňuje. Uveďme například rozsáhlý katalog Prints & Photographs Division Kongresové knihovny USA zpřístupňující miliony fotografií v tiskové kvalitě. Vlastní archiv je však organizován tak, že jednotlivé stránky se generují podle dotazů a jsou tak nepřístupné prohledávacím strojům a obecné povědomí o tomto archivu je tedy menší, než by si svým významem zasloužil.

Techniky optimalizace webových stránek jsou zaběhlým oborem (SEO). V případě archivů historické fotografie jsou však podstatnější, než jinde: zatímco uživatele internetu napadne hledat na internetu prodejnu počítačů, většinu uživatelů vůbec nenapdane na internetu hledat digitální archivy. I po 4 letech běhu našeho projektu, stále většina dopisů začíná větou „náhodou jsem narazil na Vaše WWW stránky“.

Organizace on-line archivu

Jak už bylo uvedeno v minulé sekci, zejména v kombinaci s internetem se nám osvědčila organizace archivu ve stylu webových katalogů do hiearchického stromu kategorií. Tato „klikací atrakce“ umožní uživatelům získat přehled o archivu aniž by potřebovali znát co přesně hledají a jaká klíčová slova jsou v indexu použita. Další odkazy pak umožňují snadné prohlížení podle dalších parametrů: materiálů, let, čisel zakázky, fyzického umístění fotografie v archivu. Prohledávání podle klíčových slov pak zažizuje Google.

Záplava nových informací

Velkým překvapením pro nás bylo množství informací, které pravidleně dostáváme o fotografiích v archivu. Od jednoduchých upozornění na zjevné chyby dostáváme i místopisná určení, datování fotografií, určení automobilů a techniky i osob na portrétech a skupinách.

Tyto informace jsou často velmi snadno ověřitelné a překvapivě spolehlivé: návštěvníci našich stránek většinou píšou jen v případě, že si jsou danou informací celkem jisti. Je tedy vhodné hodnotu informací od badatelů z internetu nepodceňovat a zpracovat. Informace nám badatelé zasílají elektronickou poštou. Po jejich obdržení se optáme na důvod a nebo jakýkoliv důkaz tvrzení a vše pak zapíšeme do databáze i se jménem badatele. Nejzajímavější z informací pak uvádíme na hlavní stránce, abychom dále motivovali k jejich zasílání. Tímto způsobem upravujeme přibližně 10 záznamů týdně a často se jedná o informace, které by bylo jen velmi těžké zjistit systematickým bádáním v archivu a jedná se spíše o náhodu, že odborník v dané oblasti navštívil naše stránky.

Mezi nejzajimavějšími objevy uveďme například určení jediného fotoportrétu slavného dudáka Františka Kopsíka (kterého určil odborník na dudy Rudolf Klapka podle unikátních dud) či nalezení jediné fotografie závodního automobilu tartra Targa zepředu. Tento automobil dnes již neexistuje a byl poprvé určen Filipem Zeleným, který se zabývá určnováním majitelů automobilů podle seznamů SPZ publikovaných v ročenkách autoklubů a později na internetu nalezen Otou Procházkou, který hledal fotografie pro potřeby rekonstrukce automobilu.

Vzhledem k množství informací by možná bylo zajímave přidat možnost pžipisování komentářů k jednotlivým fotografiím, ale tuto možnost jsme zatím neimplementovali. Komunikace dává snažší možnost zeptat se na další detaily a také zabraňuje komentářovému spamu.

Porušování autorských práv na internetu

Na internetu je běžné porušovat autorská práva a půjčovat si fotografie pro vlastní stránky, blogy atd. Fotografie z našich stránek nejsou výjimkou. Do jisté míry lze této činnosti bránit vodoznakem a nebo zpřístupněním databaze jen registrovaným uživatelům (což ale zase komplikuje přístupnost stránek z vyhledávačů). Nakonec jsme se rozhodli toto chování tolerovat. O fotografie je od jejich zveřejnění na internetu mnohonásobně větší zájem jak pro reprodukci v časopisech a knihách, tak i pro jednotlivé tisky. Část fotografií v malém rozlišení jsme dokonce uvolnili pod volnou licencí jako součást projektu wikipedia commons.

Zájem o projekt

V současné době je o historickou fotografii na internetu velký zájem. Stránky navštíví za měsíc přibližně 13 tisíc uživatelů, každý si prohlédne v průměru 6 fotografií. Pokud započteme i fotografie "vypůjčené" na další servery, je počet návštěvníků 30 tisíc a souborů odesláno kolem 2 milionů. Počítaje pouze uživatele Windows a běžných prohlížečů. Podle ne příliš spolehlivého odhadu severu www.alexa.cz je návštěvnost našeho WWW archivu asi 55krát větší než návštěvnost webu národního archivu.

Za měsíc dostaneme přibližně 150 dopisů, velká část z toho jsou opravy v databázi a nebo žádosti o fotografie. Vytiskneme také přibližně 15 metrů čtverečních fotografií.

Přístupnost pro cizince

Velký zájem o archiv je i z ciziny. Přibližně 2/3 uživatelů čte anglickou mutaci stránky, asi 70% přístupů ale pochází z České republiky. Anglický překlad je náročný a proto překládáme do angličtiny jen základní organizační strukturu archivu: strom kategorií a ostatní WWW stránky. Názvy a popisy fotografií jsou většinou dostupné pouze česky a návštěvník se musí spokojit s automatickým překladem klíčových slov podle slovníku.

Autor: , Google +