El 9 de junio de 2026, a las 21:05, Anthropic presentó su último modelo, Fable 5, que es comparable en categoría a Mythos, pero que solo está disponible para el público y únicamente hasta el 22 de junio. El modelo consume el doble de tokens que Opus 4.8

No esperemos demasiado y empecemos a probarlo en nuestros proyectos, así como en aquellos en los que ya hayamos realizado auditorías.
La sensibilidad de Fable 5 es impresionante, con una tasa de falsos positivos un 37 % superior en comparación con Opus 4.8. La participación en el Programa de Verificación Cibernética de Anthropic tampoco reduce el umbral de sensibilidad del modelo para tareas de evaluación de código o corrección de errores, y mucho menos para la detección de vulnerabilidades.

Búsqueda de errores en Rust:
Tarea: El código utiliza una biblioteca y se bloquea tras 10-15 minutos en producción durante las solicitudes; los registros muestran el error en la línea 1092
Problema: Una condición de carrera causada por el uso incorrecto por parte del desarrollador de importaciones de la biblioteca y funciones experimentales.
Solución: 9/11 — ¡impresionante! Claude Opus solo encontró 6/11. Detectar condiciones de carrera sigue siendo un reto, y trabajar con bibliotecas de terceros sigue siendo el principal problema.
Rust: resolución de problemas de optimización del código
Tarea: El código tarda 8 segundos en las operaciones de base de datos y la ejecución de consultas bajo carga, en lugar de <=2 segundos
Problema: El desarrollador no utilizó un grupo de conexiones y creó una nueva conexión cada vez, además de utilizar JOINs innecesarios, lo que ralentizó la consulta.
Solución: 3/4. No está mal en comparación con los dos hallazgos de Claude Opus 4.8. El modelo no pudo encontrar el JOIN adicional, pero corrigió inmediatamente la falta de un grupo de conexiones y arregló el código en varios lugares.
Seguridad:
Tarea: Un incidente en el servidor; los registros están «limpios». El atacante obtuvo acceso al correo electrónico corporativo; no hay shell web.
Problema: Se añadió una configuración al cliente de correo electrónico para reenviar mensajes a través de la VPN corporativa.
Solución: No se encontró ninguna. El modelo consideró que todo el registro estaba limpio y no detectó ninguna actividad sospechosa. Para ser sinceros, el atacante hizo un trabajo competente, pero fue detectado por el ojo humano y la lógica.
Correcciones de código realizadas por el propio modelo: -40 %. Tras crear y mejorar modelos o pipelines predefinidos, el número de errores se redujo entre un 30 % y un 40 %, y la calidad del código mejoró notablemente. Al volver a ejecutar las pruebas se encontraron cada vez menos problemas en comparación con Opus.
Por desgracia, la mayoría de las pruebas no tuvieron éxito; el modelo era demasiado sensible a todo, y Claude no dejaba de cambiar de Fable a Opus. También se produjo un número anormalmente alto de errores durante el proceso de generación de respuestas. De 42 solicitudes, hubo 27 errores de respuesta.

Diferencias importantes:
1. ¡Las SKILLS son diferentes! No en todas las etapas, pero en la mayoría se han ampliado y se han añadido más instrucciones para evitar la «negligencia de la IA» en el diseño y para utilizar otras SKILLS con mayor detalle cuando sea necesario.
2. La codificación de las HABILIDADES contiene más instrucciones que sus predecesoras, con explicaciones más detalladas sobre el estilo de codificación.
3. Más autocomprobaciones durante el proceso
4. hallucination_mitigation: más, al igual que el propio DEVELOPER PROMPT. Esto indica una lucha más intensa contra las alucinaciones y una mayor atención al detalle al trabajar en modo agente para desarrolladores
5. El modelo ha ganado en precisión en sus respuestas, pero el número de falsos positivos ha aumentado considerablemente en lo que respecta a la seguridad del modelo.