Strojové učení je a bude vždy jen tak dobré, jak kvalitní budou jeho studijní data. Ostatně, je to stejné jako s lidmi. Dobrý učitel fyziky a matematiky dokáže dětem oba problematické předměty prodat, zatímco ten špatný jim je pouze zprotiví.
Jenže dobrých studijních dat pro strojové učení je jako šafránu – vlastně je to mnohdy ten největší oříšek. Jednou z největších aktuálních výzev je například snaha naučit stroj, aby chápal význam souvislého děje. K tomu potřebuje analyzovat ohromné množství jednoduchých videí, ve kterých probíhá nějaká základní činnost a takové video je zároveň korektně dokumentované, aby stroj při učení věděl, co je to za činnost.
To v praxi znamená, že musíte připravit ideálně stovky tisíc kratičkých šotů s běžnými ději od venčení psa po vaši večeři a každé takové video musí mít textový popis – anotaci. Představa, že jako vstup dat použijete třeba zcela běžná videa z YouTube, je tedy naprosto mylná.
Kinetics pomůže komunitě vycvičit lepší A.I.
Přesně z těchto důvodů nyní britská laboratoř pro umělou inteligenci DeepMind (Google/Alphabet) představila doposud nejrozsáhlejší balík studijních videí. Říká mu Kinetics a jedná se o seznam (JSON, CSV) 300 000 připravených zhruba 10s šotů z YouTube, které znázorňují na 400 lidských akcí.
Právě tato data nyní mohou výzkumníci z celého světa použít pro učení svých neuronových sítí a dosáhnout tak mnohem lepšího výsledku než doposud.
Opět se v plné síle ukazuje, že nejlepší umělou inteligenci na bázi strojového učení vycvičí ten, kdo bude mít k dispozici nejlepší data. I proto dnes v učení hrají prim právě laboratoře Googlu. A zatím jsme zároveň daleko od okamžiku, kdy tu budeme mít univerzální strojové učení, které si bude studijní data sbírat a třídit zcela samo. Ostatně i člověk potřebuje hromadu let strávených ve školní lavici, aby se z něj mohl stát samouk.