¿Qué debo hacer al respecto? (1)

Auditar los permisos de Claude Code antes del despliegue de Mythos

¿Qué debo hacer al respecto? (2)

Mantener secretos y `.env` fuera del directorio de trabajo del agente

¿Qué debo hacer al respecto? (3)

Revisar las release notes de Anthropic buscando restricciones en entornos agentic

Claude Mythos llega a Claude Code pese a sus riesgos de seguridad

Anthropic prepara el despliegue de Claude Mythos en Claude Code, un modelo restringido por sus riesgos de seguridad sobre software público y privado.

por Gorka El Bochi Morillo

2 min lectura

·26 de mayo, 2026

Qué pasa

Anthropic está preparando el rollout público de Claude Mythos dentro de Claude Code, según BleepingComputer. Mythos fue anunciado en abril de 2026 como un modelo de capacidades avanzadas con acceso restringido, clasificado por el propio Anthropic por sus riesgos sobre software público y privado.

La particularidad de Mythos es que supera ciertos umbrales en las evaluaciones internas de Anthropic — lo que normalmente implica capacidades de *autonomous exploitation* (asistencia activa para encontrar y aprovechar vulnerabilidades) que otros modelos no tienen. No es un modelo más potente en el sentido genérico: es un modelo con capacidades específicamente relevantes para seguridad ofensiva.

Claude Code es un entorno de agentic AI (IA que opera de forma autónoma sobre sistemas reales — ejecuta código, lee ficheros, llama APIs, modifica repositorios) que corre localmente con permisos amplios sobre el entorno del desarrollador. Acoplarlo a un modelo con ese perfil de riesgo no es una decisión trivial.

Por qué importa

El problema no es el modelo aislado. Es la superficie de ataque combinada:

Un modelo con capacidades *offensive-grade* (pensado para razonar sobre vulnerabilidades a nivel experto)
Acoplado a un agente con acceso directo a tu codebase, terminal, filesystem y potencialmente tus secretos de entorno
En un contexto donde los ataques de prompt injection (manipulación del modelo mediante inputs maliciosos en el entorno — un README, un comentario de código, una respuesta de API externa) ya son vectores documentados contra agentes de código

Si Mythos tiene mayor capacidad de razonamiento sobre vulnerabilidades, también es más explotable como arma vía prompt injection: un atacante que controle cualquier texto que el agente lea podría instruirle para exfiltrar código, credenciales o ejecutar comandos no autorizados.

Anthropic ha demostrado con su Responsible Scaling Policy (RSP) que toma estos umbrales en serio. Pero desplegar Mythos en un entorno agentic — donde el modelo actúa, no solo responde — es una apuesta que merece seguimiento activo.

Qué hacer

Audita los permisos actuales de Claude Code: qué directorios puede leer, qué comandos puede ejecutar, qué APIs tiene acceso directo.
Revisa tu `.claude/settings.json`: la allowlist de permisos debe ser mínima, no un "allow all" heredado de la instalación inicial.
Mantén secretos fuera del working directory: `OPENAI_API_KEY`, tokens, ficheros `.env` — fuera del alcance del agente o en rutas excluidas explícitamente.
Sigue las release notes de Anthropic cuando Mythos se despliegue: busca específicamente las restricciones de uso en entornos agentic y los nuevos controles de seguridad que acompañen al modelo.

El patrón es conocido: los modelos más capaces llegan primero a las herramientas de devs, que son el target más valioso. Quien controla el agente que toca tu código, controla mucho más que un chatbot.

Ayuda a que más gente descubra BBLabs News.

Claude Mythos llega a Claude Code pese a sus riesgos de seguridad

Vertical Descargar imagen

LinkedIn X WhatsApp

Claude Mythos llega a Claude Code pese a sus riesgos de seguridad

Qué pasa

Por qué importa

Qué hacer

Artículos relacionados

npm malicioso apunta al directorio de Claude AI

ChatGPhish: resúmenes web de ChatGPT como vector de phishing

Claude Mythos llega al público: qué implica para seguridad