
El renderizador de chatgpt.com confía en Markdown de páginas externas, convirtiendo resúmenes web en vector de phishing vía prompt injection.
Permiso Security documentó ChatGPhish, una técnica que convierte la función de resumen web de ChatGPT en un vector de phishing. El problema está en el renderizador de chatgpt.com: cuando el modelo visita una URL para resumirla, trata como legítimo el Markdown que encuentra en la página. Si esa página contiene enlaces Markdown maliciosos, el renderizador los muestra como links clicables en la respuesta — sin ninguna advertencia visual que indique que provienen de contenido externo.
El mecanismo es la *prompt injection* (instrucción maliciosa embebida en contenido que el modelo procesa — el atacante desvía el comportamiento del modelo sin acceso directo) indirecta. El atacante no necesita interactuar con el modelo directamente. Basta con que la víctima pida a ChatGPT que resuma una página bajo control del atacante. El modelo obedece el Markdown embebido y entrega un link de phishing como si fuera parte de su respuesta legítima.
El phishing clásico requiere que el usuario reciba un email sospechoso o llegue a una URL maliciosa por su cuenta. ChatGPhish elimina esa fricción: la víctima actúa desde la interfaz de ChatGPT, un entorno que percibe como seguro. El link malicioso no llega en un email de spam — llega dentro de la respuesta del asistente de IA en el que confía.
Eso eleva el nivel de credibilidad del ataque de forma significativa. Los usuarios entrenados para desconfiar de links en emails no tienen un reflejo equivalente para links dentro de respuestas de ChatGPT. La superficie afecta a cualquier usuario con acceso a la función de navegación web — millones de cuentas en planes Plus, Pro y Team.
El patrón además es replicable. Cualquier LLM que renderice Markdown de contenido externo sin sanitizarlo tiene la misma exposición: Microsoft Copilot, Google Gemini, cualquier agente con herramienta de browse. ChatGPhish no es un bug único de OpenAI — es un problema de diseño sistémico en cómo los LLMs gestionan la confianza sobre contenido externo.
La raíz del problema no es exclusiva de ChatGPT: ningún renderizador de Markdown en un LLM debería heredar implícitamente la confianza del usuario sobre contenido externo. Hasta que OpenAI y el resto de vendors corrijan esto a nivel de renderer — con advertencias explícitas de origen externo o deshabilitando el render de links provenientes de páginas visitadas — el vector sigue abierto en producción.
Ayuda a que más gente descubra BBLabs News.
¿Quieres recibir noticias así cada día?
Ver todos los artículos