sistema: OPERATIVO
← volver a todos los hacks
DEFENSE MEDIUM

Project Glasswing: Claude Mythos halla más de 10 000 bugs críticos en un mes

La actualización publicada por Anthropic el 26 de mayo de 2026 indica que cerca de 50 socios de Project Glasswing han usado Claude Mythos Preview para identificar más de 10 000 vulnerabilidades de severidad alta o crítica, incluidas 271 fallas latentes parcheadas en Firefox 150.

2026-05-26 // 8 min affects: firefox-150, wolfssl, cloudflare-edge, open-source-projects

¿De qué se trata?

El 26 de mayo de 2026 Anthropic publicó Project Glasswing: An initial update. Un mes después del lanzamiento, la empresa reporta que aproximadamente 50 organizaciones socias han utilizado Claude Mythos Preview — un modelo de frontera no liberado, con fuertes capacidades ofensivas en ciberseguridad — para identificar más de 10 000 vulnerabilidades de severidad alta o crítica en software de importancia sistémica. Varios socios reportan que su tasa interna de hallazgo de bugs se ha multiplicado por diez o más.

El dato que retendrán las personas defensoras viene de Mozilla. En una publicación del blog Mozilla Hacks del 7 de mayo de 2026, el equipo de seguridad de Firefox reveló que 271 vulnerabilidades latentes identificadas con Mythos Preview se parchearon en Firefox 150, incluidas 180 de severidad alta y 80 de severidad moderada. Tres están acreditadas explícitamente a Claude en el aviso de Mozilla: CVE-2026-6746, CVE-2026-6757, CVE-2026-6758. Cloudflare reporta 2 000 bugs (400 de severidad alta o crítica) en sus sistemas de ruta crítica, con una tasa de falsos positivos que el equipo considera mejor que la de los testers humanos.

Los socios de lanzamiento de Project Glasswing incluyen AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks. Claude Mythos Preview no está disponible al público general; Anthropic ha indicado su intención de liberar los modelos de la clase Mythos al público una vez que los controles de seguridad se consideren suficientes.

Cómo funciona

Mythos Preview no es un escáner especializado de seguridad. Es un modelo de frontera de propósito general cuyas capacidades de programación han cruzado un umbral que Anthropic califica de ofensivo-ciber. La evaluación previa al despliegue del UK AI Safety Institute reporta que el modelo completa una simulación de ataque a red corporativa de 32 pasos en 3 de cada 10 intentos, encadenando varias fallas pequeñas en una intrusión de extremo a extremo.

Los socios no apuntan Mythos a su código y esperan. La descripción de Mozilla detalla un arnés agéntico específico del codebase que envuelve a Mythos junto con otros modelos de frontera con el sistema de build, el andamiaje de pruebas y las convenciones de triaje del proyecto. Los bugs pasan por revisión humana antes de llegar a la cola de parches.

Etapa                  Qué corre                       Qué produce
---------------------  ------------------------------  --------------------------------
Configuración arnés    Herramientas, build graph,      Andamiaje agéntico por objetivo
                       runners específicos del proyecto
Escaneo agéntico       Mythos Preview + modelos        Hallazgos candidatos con traza
                       de frontera de apoyo            de razonamiento e intento de PoC
Filtrado / dedupe      Reglas de pipeline + triaje     Cola de hallazgos con señal
                       LLM ligero
Triaje humano          Equipo de seguridad Mozilla     Bugs confirmados, decisiones CVE,
                       / del socio                     planificación de fix
Parche + release       Proceso estándar de release     Firefox 150 / entradas de advisory

La mejora de señal sobre ruido es clave. Hasta fines de 2025, los reportes de bugs generados por IA enviados a proyectos de código abierto eran sobre todo slop — plausibles a la vista, a menudo equivocados, costosos de triar. Dos cosas cambiaron: los modelos ahora pueden verificar sus propias afirmaciones con código, y proyectos como Mozilla han aprendido a dirigir, escalar y apilar los modelos dentro de un arnés que refleja su codebase, en vez de tratar al LLM como un escáner de caja negra. Anthropic reporta una tasa de verdaderos positivos de ~90 % tras el triaje en su escaneo interno de más de 1 000 proyectos open source, con 23 019 incidencias brutas reducidas a 6 202 de severidad alta/crítica, encaminado a producir ~3 900 vulnerabilidades de severidad alta/crítica en open source una vez concluida la revisión. Un ejemplo concreto de la actualización: Mythos halló una falla en wolfSSL y construyó un exploit que permitiría a un atacante forjar certificados para suplantar un banco o un proveedor de correo — divulgada y parcheada bajo divulgación coordinada.

Aquí no se reproduce código de exploit ni payload. La actualización de Anthropic, la publicación de Mozilla Hacks, los artículos de SecurityWeek y Help Net Security, y la entrada del 7 de mayo de Simon Willison son las referencias canónicas.

Por qué importa

Tres propiedades hacen que este momento sea cualitativamente distinto a ciclos previos de «IA para AppSec».

Primero, escala con calidad. Diez mil bugs de severidad alta o crítica en un mes está aproximadamente un orden de magnitud por encima de lo que las organizaciones socias encontraban antes. La comparación con Cloudflare — tasas de falsos positivos mejores que las de testers humanos experimentados — es la métrica que mueve el programa de «interesante» a «adoptado en operaciones».

Segundo, el mismo modelo halla y arma. Mythos identificó la falla de wolfSSL y construyó la cadena de exploit para la forgería de certificados; la evaluación del UK AISI muestra comportamientos de intrusión multi-paso. El propio marco de la página de lanzamiento de Project Glasswing es explícito: el programa existe porque modelos con esta capacidad serán pronto desarrollados por múltiples empresas, y nadie ha desplegado todavía controles de seguridad suficientes para liberarlos al público. El uso defensivo es real; el riesgo de doble uso también.

Tercero, se prueba en público un nuevo patrón de gobernanza. Anthropic no ha elegido ni la liberación total ni el secreto total. Mythos Preview se distribuye bajo un programa de acceso restringido a un grupo reducido de socios de infraestructura crítica, con actualizaciones públicas de avance. Si este modelo escalará — a gobiernos aliados, al ecosistema open source en sentido amplio, a proveedores medianos sin un equipo de seguridad del tamaño del de Cisco — es la pregunta de política pública de los próximos doce meses.

Defensas

No existe una mitigación única para una capacidad de IA de esta clase. El playbook defensivo para el resto del ecosistema, extraído de los informes de Mozilla, Anthropic y Cloudflare citados arriba:

  1. Asuma que existe un modelo con capacidad ofensiva fuera de su perímetro. Considere que en 12-24 meses un actor no-Glasswing dispondrá de algo de clase Mythos. Las clases de memoria insegura (use-after-free, OOB read/write), TOCTOU y mal uso criptográfico siguen siendo los objetivos de alto rendimiento que destacó el aviso de Firefox.
  2. Migre las rutas calientes a lenguajes con seguridad de memoria. Los bugs más peligrosos hallados por Claude en Firefox 150 eran UAF en componentes DOM y WebRTC. La adopción de Rust u otros lenguajes seguros por construcción en navegadores, núcleos y parsers de protocolos es la única defensa estructural — el resto solo compra tiempo.
  3. Invierta en su propio pipeline de revisión asistida por IA. Los proveedores sin acceso a socios Glasswing aún pueden ejecutar modelos de frontera abiertos dentro de un arnés específico de su proyecto. El blueprint de Mozilla — semántica del codebase en el prompt, salida del modelo filtrada por verificaciones deterministas, revisión humana solo tras el filtro — es reproducible sin capacidad de clase Mythos.
  4. Active capacidad de divulgación coordinada a volumen de IA. Un mantenedor habituado a 1-2 advisories por trimestre no absorbe 271 en una sola release. Los proyectos open source deberían refrescar su security.txt, anticipar advisories masivos y considerar bloques de CVE pre-asignados con su CNA.
  5. Exija claridad sobre los CVE atribuidos a IA. Mozilla acreditó a Claude en 3 de más de 40 CVE en Firefox 150. La comunidad necesita una convención explícita para acreditar descubrimiento asistido por IA, validar reproducibilidad y distinguir «la IA lo halló» de «la IA lo escribió para el atacante».
  6. Observe el propio modelo de control de acceso. Programas restringidos como Glasswing son un experimento de gobernanza. Quienes defienden infraestructuras críticas y no son socios deberían preguntar a sus proveedores si — y cómo — se está aplicando endurecimiento asistido por IA al software del que dependen.
  7. No confíe en que el modelo siga restringido. Anthropic ha dicho públicamente que pretende liberar modelos de clase Mythos una vez listos los controles, y una capacidad equivalente surgirá en otros laboratorios pase lo que pase. Planifique para el día en que la puerta se abra.

Estado

ElementoReferenciaFechaNotas
Actualización AnthropicProject Glasswing: An initial update2026-05-26~50 socios, 10 000+ vulns altas/críticas
Publicación MozillaMozilla Hacks2026-05-07271 vulns en Firefox 150 (180 altas, 80 moderadas)
Créditos públicosAviso Firefox 1502026-05CVE-2026-6746, CVE-2026-6757, CVE-2026-6758
Aporte de CloudflareActualización Anthropic2026-05-262 000 bugs / 400 altos o críticos
Escaneo open sourceActualización Anthropic2026-05-2623 019 brutos, 6 202 altos/críticos, ~90 % TP
Ejemplo concretoForgería de certificado wolfSSL2026-05Hallazgo y exploit construidos por Mythos
Evaluación pre-despliegueUK AISI2026-04Ataque de red de 32 pasos, 3/10
Modelo de distribuciónProject Glasswingdesde 2026-04Acceso restringido solo a socios

La lectura en titular — «la IA halló 10 000 bugs» — subestima lo que realmente está en juego. Project Glasswing es el primer intento de un laboratorio de frontera por llevar un modelo con capacidad ofensiva a la cadena de suministro defensiva sin entregarlo a todo el mundo. Que ese modo de liberación controlada se convierta en norma, o que sea superado por la próxima publicación equivalente en otro lugar, dará forma al AppSec del resto de la década.

Sources