9 июня 2026 года в 21:05 компания Anthropic представила свою новейшую модель Fable 5, которая по классу сопоставима с Mythos, но доступна для общего пользования только до 22 июня. Эта модель потребляет в два раза больше токенов, чем Opus 4.8


Опишите изображение

Не будем слишком долго ждать и начнем тестировать ее на наших проектах, а также на тех, где мы уже проводили аудиты.


Чувствительность Fable 5 впечатляет: уровень ложных срабатываний на 37% выше, чем у Opus 4.8. Участие в программе киберверификации Anthropic также не снижает порог чувствительности модели при оценке кода или исправлении ошибок, не говоря уже об обнаружении уязвимостей.


Опишите изображение


Поиск ошибок в Rust:

Задача: код использует библиотеку и вылетает через 10–15 минут в производственной среде во время запросов; в логах показана ошибка в строке 1092

Проблема: Условие гонки, вызванное неправильным использованием разработчиком импортов из библиотеки и экспериментальных функций.

Решение: 9 из 11 — впечатляет! Claude Opus нашел только 6 из 11. Поиск условий гонки по-прежнему остается сложной задачей, а работа со сторонними библиотеками — основной проблемой.


Rust: решение проблем с оптимизацией кода

Задача: код тратит 8 секунд на операции с базой данных и выполнение запросов под нагрузкой вместо <=2 секунд

Проблема: Разработчик не использовал пул соединений и создавал новое соединение каждый раз, а также использовал ненужные JOIN, что замедляло запрос.

Решение: 3 из 4. Неплохо по сравнению с двумя находками Claude Opus 4.8. Модель не смогла найти лишний JOIN, но сразу исправила отсутствие пула соединений и исправила код в нескольких местах.


Безопасность:

Задача: инцидент на сервере; журналы «чистые». Злоумышленник получил доступ к корпоративной электронной почте; веб-оболочки нет.

Проблема: в почтовый клиент была добавлена настройка для пересылки сообщений через корпоративный VPN.

Решение: Не найдено. Модель сочла весь журнал чистым и не обнаружила подозрительной активности. Честно говоря, злоумышленник поработал грамотно, но его обнаружили человеческий глаз и логика.


Исправления кода, сделанные самой моделью: -40%. После создания и улучшения готовых моделей или конвейеров количество ошибок снизилось на 30–40%, а качество кода заметно улучшилось. При повторном запуске тестов обнаруживалось все меньше и меньше проблем по сравнению с Opus.


К сожалению, большинство тестов оказались неудачными; модель была слишком чувствительна ко всему, и Клод постоянно переключался с Fable на Opus. Также наблюдалось аномально высокое количество ошибок в процессе генерации ответов. Из 42 запросов было 27 ошибок ответа.

Опишите изображение


Важные различия:

1. SKILLS изменились! Не на всех этапах, но в большинстве случаев они стали более обширными, и было добавлено больше инструкций, чтобы избежать «небрежности ИИ» в дизайне и более детально использовать другие SKILLS при необходимости.

2. Код SKILLS содержит больше инструкций, чем у его предшественников, с более подробными объяснениями относительно стиля кодирования.

3. Больше самопроверок в процессе

4. hallucination_mitigation — больше, как и сам DEVELOPER PROMPT. Это указывает на более активную борьбу с галлюцинациями и большее внимание к деталям при работе в режиме агента для разработчиков

5. Модель стала более точной в своих ответах, но количество ложных срабатываний резко возросло в случае безопасности модели.