9. června 2026 v 21:05 společnost Anthropic představila svůj nejnovější model Fable 5, který je srovnatelný s modelem Mythos, je však k dispozici pouze veřejnosti a to pouze do 22. června. Tento model spotřebovává dvakrát více tokenů než Opus 4.8

Nečekejme příliš dlouho a začněme jej testovat na našich projektech, stejně jako na projektech, u nichž jsme již provedli audity.
Citlivost modelu Fable 5 je působivá, s o 37 % vyšší mírou falešných pozitiv ve srovnání s Opus 4.8. Účast v programu Cyber Verification Program společnosti Anthropic rovněž nesnižuje prahovou hodnotu citlivosti modelu pro úkoly hodnocení kódu nebo opravy chyb, natož pro detekci zranitelností.

Hledání chyb v Rustu:
Úkol: Kód používá knihovnu a během požadavků v produkčním prostředí dojde po 10–15 minutách k selhání; protokoly ukazují chybu na řádku 1092
Problém: Podmínka závodu způsobená nesprávným použitím importů z knihovny a experimentálních funkcí vývojářem.
Řešení: 9/11 – působivé! Claude Opus našel pouze 6/11. Nalezení závodních podmínek zůstává výzvou a práce s knihovnami třetích stran zůstává hlavním problémem.
Rust: řešení problémů s optimalizací kódu
Úkol: Kód stráví 8 sekund operacemi s databází a prováděním dotazů pod zátěží namísto <=2 sekund
Problém: Vývojář nepoužil pool připojení a pokaždé vytvořil nové připojení, stejně jako použil zbytečné JOINy, což zpomalilo dotaz.
Řešení: 3/4. To není špatné ve srovnání se dvěma nálezy z Claude Opus 4.8. Model nebyl schopen najít nadbytečný JOIN, ale okamžitě opravil chybějící pool připojení a opravil kód na několika místech.
Zabezpečení:
Úkol: Incident na serveru; protokoly jsou „čisté“. Útočník získal přístup k firemní e-mailové schránce; žádný webový shell.
Problém: Do e-mailového klienta bylo přidáno nastavení pro přeposílání zpráv přes firemní VPN.
Řešení: Žádné nalezeno. Model považoval celý protokol za čistý a nezjistil žádnou podezřelou aktivitu. Upřímně řečeno, útočník odvedl dobrou práci, ale byla odhalena lidským okem a logikou.
Opravy kódu provedené samotným modelem: -40 %. Po vytvoření a vylepšení předem připravených modelů nebo pipeline se počet chyb snížil o 30–40 % a kvalita kódu se znatelně zlepšila. Při opakovaném spuštění testů bylo nalezeno stále méně problémů ve srovnání s Opusem.
Bohužel většina testů byla neúspěšná; model byl příliš citlivý na všechno a Claude neustále přepínal z Fable na Opus. Během procesu generování odpovědí se také vyskytlo abnormálně vysoké množství chyb. Z 42 požadavků došlo k 27 chybám v odpovědích.

Důležité rozdíly:
1. SKILLS se liší! Ne ve všech fázích, ale ve většině případů se staly rozsáhlejšími a bylo přidáno více pokynů, aby se zabránilo „nedbalosti AI“ v návrhu a aby bylo možné v případě potřeby podrobněji využít jiné SKILLS.
2. Kódování SKILLS obsahuje více pokynů než jeho předchůdci, s podrobnějšími vysvětleními týkajícími se stylu kódování.
3. Více samokontrol během procesu
4. hallucination_mitigation – více, stejně jako samotný DEVELOPER PROMPT. To naznačuje silnější boj proti halucinacím a větší pozornost věnovanou detailům při práci v režimu agenta pro vývojáře
5. Model se stal přesnější ve svých odpovědích, ale v případě bezpečnosti modelu prudce vzrostl počet falešných pozitiv.