„Neuronové sítě jsou trošku jako z Terminátora,“  říká Vítězslav Válka

vita-valka-small

 

Aby náš pohled na autotagging nebyl úplně jednostranný, rozhodli jsme se zeptat na pár dotazů, které nás zajímaly, přímo někoho z Pond5. Na otázky týkající se implementace, fungování a budoucnosti autotaggingu nám ochotně odpověděl Vítězslav Válka, šéf vývoje produktu.

 

Před pár týdny jste na Pond5.com spustili funkci autotaggingu, tedy automatického přiřazování klíčových slov k vybraným druhů nahraných médií. Jak vznikl nápad inovovat tímto nástrojem služby vaší fotobanky?

Pond5 vždy měl chuť dělat pro uživatele o něco víc než ostatní konkurenti. Ať je to nezvykle vysoký výnos z prodejů činící 50%, nebo možnost nastavit si cenu libovolně podle toho, jak to autor fotky či videa cítí. A když se v posledních letech neuronové sítě dostaly na úroveň, kdy jde v rozumném čase data prohledávat, byla to jasná nahrávka na tuto technologii netextového vyhledávání.

K dosažení co nejrelevatnějších keywordů využívá váš systém autotaggingu princip umělých neuronových sítí. Je možné v krátkosti popsat, jaké jsou hlavní přednosti tohoto řešení?

Neuronové sítě se samy dokážou učit z toho, co už vědí. Takže jim stačí „předhodit“ jen malý vzorek dat a výsledky budou překvapivě přesné. Navíc lze síť dále doučovat, což také děláme. Tím, že sledujeme, co uživatelé s nabízenými klíčovými slovy dělají. Jinými slovy – aktivita uživatelů v čase zlepšuje výsledky. Trošku jako z filmu Terminátor.

Vyzkoušeli jsme autotagging fotobanky Pond5

Na začátku dubna spustila fotobanka Pond5 velice zajímavou službu „Auto-Tagging“, kterou lze v daném odvětví označit přívlastkem „jedinečná“. Fotografie, ilustrace a videa nahraná prodávajícími jsou nyní automaticky doplňována o klíčová slova, k čemuž Pond5 využívá principu umělých neuronových sítí. Možnostmi autotaggingu se již zabývaly některé další společnosti, jako například bulharský start-up Imagga, ještě nikdy ovšem nebyla tato funkce natolik integrována přímo do fotobanky. Přirozeně nás lákalo vyzkoušet, nakolik spolehlivý tento nástroj doopravdy je.

Je autotaggíng nástrojem čistě z „vaší kuchyně“, nebo se na vývoji takto specializovaného nástroje musí podílet více subjektů?

Spolupracujeme s českou společností Ximilar už od dob Pixmac. Ale tento kalibr je z dílny světově uznávané společnosti, která v neuronových sítích vyhrála několik prestižních cen. Na druhou stranu musím říci, že nasazení autotaggingu vyžadovalo několik měsíců ladění a zkoumání. V této oblasti existuje několik společností, které se zaměřují na různé typy obsahu (obraz, zvuk) a také používají různé techniky indexování a porovnávání dat – lokální objekty, celkový fingerprint a podobně.

Kolik času zabral vývoj a implementace autotaggingového softwaru?

Implementace zabrala měsíce. Neuronové sítě začínají nabírat obrátky v posledních letech. A to zejména díky rychlým GPU, které dokážou tak náročné operace včas spočítat.

V čem spatřujete hlavní přínos autotaggingu pro prodejce? Může třeba i na základě automaticky přiřazených klíčových slov zjistit, zda tagy nepoužívá špatně či neefektivně?

Profesionál už má své procesy vyladěné a patrně pro něj autotagging nebude velkým přnosem. Pro mainstream a amatéry je to však dar z nebes. Dříve člověk trávil řekněme 1-5 minut hledáním a vymýšlením vhodných slov u každé položky. S autotagingem vám stačí 10 vteřin na odmazání nevhodných tagů. A to není vše. Stále víc lidí fotí mobilem a ten není na psaní textů úplně komfortní – s autotagingem nahrajete tak média na Pond5 víceméně jedním kliknutím a nemusíte o fotobankách a keywordingu vědět nic.

Jaké chyby dle vašich zkušeností autoři fotografií při přiřazování klíčových slov nejčastěji činí?

Mluví v řeči fotografa a nikoliv zákazníka. Popisují objekty, které v obrázku nebo videu nejsou téměř vidět. Nepoužívají slovník kupujícího, ale vlastní. Také třeba zapomínají na překlepové varianty slov.

Autotagging rozhodně není nástrojem, který by ustrnul na místě. Jaké další možnosti rozvoje této služby do budoucna vidíte?

Je to celý vesmír možností. Dovedu si představit, že autotagging pomůže zpřesnit výsledky vyhledávání i u médií, které už máme v databázi nahrané, nebo například dokážeme takto snadno tagovat Public Domain obsah, který bývá často úplně bez klíčových slov. Ostatně Public Domain obsah už na Pond5 od letošního ledna také je, něco přes 77 tisíc položek.

Doporučte nás...Share on Facebook0Share on Google+0Tweet about this on Twitter0Share on LinkedIn0Digg this