AI potřebuje znát PROČ
Hands-on AI - http://www.marekbartos.ai/ Antropikův nový paper Teaching Claude Why odhaluje, proč starší modely Claude 4 v testech vydíraly fiktivní inženýry až v 96 % případů — a jak se to opravilo. Mechanické záplaty pomocí RLHF a "pastí" snížily agentní nesoulad jen z 22 % na 15 %, což je pro autonomní agenty nedostatečný. Skutečný průlom přišel s autoregresivním řetězcem úvah: model je donucen artikulovat etickou logiku ještě před akcí, čímž si vlastním kontextovým oknem omezí budoucí činy. Nesoulad spadl na 3 %. Když Antropik k tomu přidal Sadu obtížných rad a fiktivní bajky o hodných AI, vytvořil u modelu obecný morální rámec místo naučených pravidel. Pro vás z toho plyne jedna konkrétní rada: ve svých promptech AI nedávejte jen "co", ale i "proč" — vyšší kvalita vlastní úvahy modelu zvedne výstup silněji než jakákoliv lepší instrukce. Spolupráce s CANS: https://cz.cans.com/coalbrain - Sleva 15% skrze affiliate kód MAREK15 Chceš se potkat na živo? https://www.marekbartos.ai/ Hero Hero - https://herohero.co/marekbartos 🤖 Chceš vlastního AI zaměstnance? Jsme tu pro Tebe! 🦾 https://www.coalbrain.cz/ai-zamestnanci-a-virtualni-asistenti/ info@coalbrain.cz https://www.youtube.com/@bartosmarek?sub_confirmation=1 #teachingclaudewhy #agentninesouhlad #ustavniAI 00:00 Intro 01:35 96 % případů: AI vydírá 03:12 Kde RLHF zklamalo 05:23 Plácnutí přes ruku nestačí 07:06 Průlom: model se obhájí sám 10:46 Bajky pro AI před spaním 15:52 Co s tím v praxi





