Jak AI vidí svět? Od pixelů po čtení obrázků

Přemýšleli jste někdy nad tím, jak je možné, že umělá inteligence dokáže rozpoznat, co je na fotce? V tomto videu si podrobně a názorně vysvětlíme, co to vlastně digitální obrázek je a jak ho stroje interpretují. Podíváme se na jeho 3D strukturu (výška, šířka, hloubka) a rozebereme, jak intenzita barevných kanálů RGB tvoří každý jeden pixel. V druhé části se ponoříme do samotného „mozku“ AI. Ukážu vám, jak moderní algoritmy (tzv. Vision Transformers) nepohlížejí na fotku jako na celek, ale rozsekají si ji na tzv. patches (dlaždice). Ty pak zploští na vektory a čtou je v logických souvislostech, podobně jako my čteme slova ve větě. Celý proces si demonstrujeme v interaktivní aplikaci, aby bylo hned jasné, jak se z barevných bodů stávají data, kterým AI rozumí. 00:00 Úvod 00:14 Fotka jako 3D objekt 02:17 Co jsou patches 03:52 Závěr

Zdroj

AI pro všechny

Jak AI vidí svět? Od pixelů po čtení obrázků

Zdroj

Další doporučený obsah

Jak řídit firmu s AI agenty a nezbláznit se z toho (Jan Červinka)

💥 Nová epizoda a problém, o kterém se málo mluví. AI a energie. Jaká nás čeká budoucnost? #ai #short

Filmy, Vary, Mongolsko a nový hlasový Chatgpt v roli našeho hosta. Funguje? | Chytrá a umělá podcast

TENHLE AI MODEL JE TAK SILNÝ, ŽE HO USA ZAKÁZALY. Co umí Fable 5?

Díky AI vydělává Petr Zahradník stamiliony, ale varuje: Pozor, může lidem i strašně ublížit

Odejdi z Lovable do Claude Code (a ušetři tisíce)