Jak AI vidí svět? Od pixelů po čtení obrázků
Přemýšleli jste někdy nad tím, jak je možné, že umělá inteligence dokáže rozpoznat, co je na fotce? V tomto videu si podrobně a názorně vysvětlíme, co to vlastně digitální obrázek je a jak ho stroje interpretují. Podíváme se na jeho 3D strukturu (výška, šířka, hloubka) a rozebereme, jak intenzita barevných kanálů RGB tvoří každý jeden pixel. V druhé části se ponoříme do samotného „mozku“ AI. Ukážu vám, jak moderní algoritmy (tzv. Vision Transformers) nepohlížejí na fotku jako na celek, ale rozsekají si ji na tzv. patches (dlaždice). Ty pak zploští na vektory a čtou je v logických souvislostech, podobně jako my čteme slova ve větě. Celý proces si demonstrujeme v interaktivní aplikaci, aby bylo hned jasné, jak se z barevných bodů stávají data, kterým AI rozumí. 00:00 Úvod 00:14 Fotka jako 3D objekt 02:17 Co jsou patches 03:52 Závěr
![Cover: [FULL NÁVOD] Jak propojit Claude Cowork + NotebookLM za 15 minut (A automatizovat obsah)](https://i.ytimg.com/vi/BDoSbvdAf1M/hqdefault.jpg)




