
Claude Mythos llega a Claude Code pese a sus riesgos de seguridad
Anthropic prepara el despliegue de Claude Mythos en Claude Code, un modelo restringido por sus riesgos de seguridad sobre software público y privado.
Qué pasa
Anthropic está preparando el rollout público de Claude Mythos dentro de Claude Code, según BleepingComputer. Mythos fue anunciado en abril de 2026 como un modelo de capacidades avanzadas con acceso restringido, clasificado por el propio Anthropic por sus riesgos sobre software público y privado.
La particularidad de Mythos es que supera ciertos umbrales en las evaluaciones internas de Anthropic — lo que normalmente implica capacidades de *autonomous exploitation* (asistencia activa para encontrar y aprovechar vulnerabilidades) que otros modelos no tienen. No es un modelo más potente en el sentido genérico: es un modelo con capacidades específicamente relevantes para seguridad ofensiva.
Claude Code es un entorno de agentic AI (IA que opera de forma autónoma sobre sistemas reales — ejecuta código, lee ficheros, llama APIs, modifica repositorios) que corre localmente con permisos amplios sobre el entorno del desarrollador. Acoplarlo a un modelo con ese perfil de riesgo no es una decisión trivial.
Por qué importa
El problema no es el modelo aislado. Es la superficie de ataque combinada:
- Un modelo con capacidades *offensive-grade* (pensado para razonar sobre vulnerabilidades a nivel experto)
- Acoplado a un agente con acceso directo a tu codebase, terminal, filesystem y potencialmente tus secretos de entorno
- En un contexto donde los ataques de prompt injection (manipulación del modelo mediante inputs maliciosos en el entorno — un README, un comentario de código, una respuesta de API externa) ya son vectores documentados contra agentes de código
Si Mythos tiene mayor capacidad de razonamiento sobre vulnerabilidades, también es más explotable como arma vía prompt injection: un atacante que controle cualquier texto que el agente lea podría instruirle para exfiltrar código, credenciales o ejecutar comandos no autorizados.
Anthropic ha demostrado con su Responsible Scaling Policy (RSP) que toma estos umbrales en serio. Pero desplegar Mythos en un entorno agentic — donde el modelo actúa, no solo responde — es una apuesta que merece seguimiento activo.
Qué hacer
- Audita los permisos actuales de Claude Code: qué directorios puede leer, qué comandos puede ejecutar, qué APIs tiene acceso directo.
- Revisa tu `.claude/settings.json`: la allowlist de permisos debe ser mínima, no un "allow all" heredado de la instalación inicial.
- Mantén secretos fuera del working directory: `OPENAI_API_KEY`, tokens, ficheros `.env` — fuera del alcance del agente o en rutas excluidas explícitamente.
- Sigue las release notes de Anthropic cuando Mythos se despliegue: busca específicamente las restricciones de uso en entornos agentic y los nuevos controles de seguridad que acompañen al modelo.
El patrón es conocido: los modelos más capaces llegan primero a las herramientas de devs, que son el target más valioso. Quien controla el agente que toca tu código, controla mucho más que un chatbot.
Comparte esta noticia
Ayuda a que más gente descubra BBLabs News.
¿Quieres recibir noticias así cada día?
Ver todos los artículos