
Anthropic confirma el despliegue público de los modelos Claude Mythos-class, retrasados por riesgos de seguridad en software.
Anthropic ha confirmado que sus modelos Claude Mythos-class llegarán al público general. El matiz relevante: el despliegue se había retrasado deliberadamente por *riesgos de seguridad para software público y privado* — no por problemas técnicos ni de rendimiento.
Eso es inusual. Las grandes labs rara vez admiten que un modelo estaba listo pero lo bloquearon por capacidades ofensivas. Que Anthropic lo comunique públicamente implica que la evaluación de riesgo ya pasó algún umbral interno, y que la decisión de sacar el modelo igualmente es consciente.
Los detalles exactos del tipo de riesgo no están completamente detallados en la confirmación inicial, pero el framing — "riesgos para software público y privado" — apunta a capacidades como generación autónoma de exploits, detección de vulnerabilidades zero-day, o asistencia avanzada en *post-explotación* (acciones que realiza un atacante tras comprometer un sistema).
Estamos ante el primer caso documentado públicamente en que una lab top retiene un modelo frontier por riesgo de seguridad ofensiva y luego lo libera de todas formas. Eso abre varias preguntas concretas:
El impacto real no es que el modelo exista — es que ahora estará embebido en miles de herramientas de terceros en semanas.
La decisión de Anthropic de publicar el modelo a pesar del historial de riesgo es una apuesta calculada. Para los equipos de seguridad, el trabajo empieza ahora: el modelo llega, los controles tienen que llegar antes.
Ayuda a que más gente descubra BBLabs News.
¿Quieres recibir noticias así cada día?
Ver todos los artículos