OFFENSIVE AI MEDIUM

La primera ola de CVE: el descubrimiento asistido por IA reconfigura los volúmenes de divulgación

El análisis de VulnCheck del 14 de mayo de 2026 muestra una subida YTD de +563 % en Chrome, +476 % en GitHub, +180 % en VMware, +170 % en Apache. El giro sistémico tras los titulares de Apple, Mozilla y ActiveMQ ya es visible en las cifras.

2026-05-27 // 7 min affects: chrome, firefox, microsoft-windows, apache-activemq, vmware, github-advisories, f5, hpe, curl, palo-alto-networks

¿Qué es esto?

El 14 de mayo de 2026, Patrick Garrity (VulnCheck) publicó The First CVE Wave: Signs That AI-Assisted Vulnerability Discovery Is Reshaping Disclosure Volumes. El artículo no trata de un único fallo. Examina las veinte principales CVE Numbering Authorities (CNA) en cinco años y muestra que, desde principios de 2026, los volúmenes de divulgación pública se disparan en grandes proveedores y proyectos open source con un patrón que coincide con el calendario público de los modelos de frontera para descubrimiento de vulnerabilidades.

Las cifras, YTD a mediados de mayo de 2026:

Chrome: +563,2 %
VMware: +180,9 %
Apache: +170,3 %
Mozilla: +156,9 %
HPE: +132,3 %
F5: +113,8 %
Emisiones CVE de GitHub (en muchos proyectos open source): +476,07 %

Dos Patch Tuesdays después del anuncio de Project Glasswing y Claude Mythos Preview por parte de Anthropic el 7 de abril de 2026, la señal que los defensores esperaban aparece en el feed público de CVE. Es la meta-historia detrás de los casos individuales ya cubiertos aquí — incluido el boletín de Apple del 11 de mayo que acredita a Claude en dos CVE de macOS — y cambia cómo deben dimensionarse los SLA de parcheo.

Cómo funciona

No hay ataque novedoso aquí. El «cómo» es el pipeline que produce estas divulgaciones, no un payload. En todos los proveedores examinados por VulnCheck, la forma es consistente:

Base de código (objetivo)
        │
        ▼
Modelo de frontera con lectura de código + razonamiento
(Anthropic Mythos / Claude Opus 4.7 / GPT-5.5-Cyber / Gemini)
        │
        ▼
Pattern-recall sobre la superficie
(clases de bug conocidas: UAF, integer overflow, SSRF,
 path traversal, deserialización, bypass de auth…)
        │
        ▼
Lista de candidatos → triaje humano
(el investigador descarta falsos positivos, valida los reales)
        │
        ▼
Repro funcional / borrador de aviso
        │
        ▼
Divulgación al vendor → CVE emitido → feed público

Tres participantes han descrito públicamente este flujo en mayo de 2026.

Mozilla es la más transparente. El equipo Firefox confirmó el 13 de mayo que desde febrero trabaja «sin parar usando modelos de IA de frontera para encontrar y corregir vulnerabilidades latentes del navegador», y que una versión temprana de Claude Mythos Preview se aplicó a Firefox como parte de la colaboración Glasswing. El +156,9 % YTD en CVE de Mozilla proviene de ese programa, no de una ola de atacantes externos.

Apache participa en el mismo programa. Anthropic donó 1,5 M$ a la Apache Software Foundation para absorber la carga de divulgación. El primer ejemplo destacado es CVE-2026-34197, un RCE en ActiveMQ vía la consola Jolokia, atribuido a Naveen Sunkavally trabajando con Claude. En sus propias palabras: «This was 80% Claude with 20% gift-wrapping by a human.» El CVE ya está incluido en CISA KEV (Known Exploited Vulnerabilities).

Microsoft confirmó el 12 de mayo de 2026 que los hallazgos por IA «pueden escalar», y vinculó el volumen del Patch Tuesday del 13 de mayo — junto a una revisión retrospectiva de cinco años de casos CLFS en MSRC — a su propio sistema agéntico multi-modelo.

El contrapunto honesto viene de Daniel Stenberg, mantenedor de Curl, que revisó los hallazgos de Mythos el 11 de mayo y reportó que, de cinco envíos «confirmados», solo uno superó la revisión de su equipo de seguridad como CVE real. Curl es una de las bases de código más fuzzeadas del planeta, lo que pone un listón alto; el resultado es una calibración útil sobre cuánto de la ola es señal real frente a ruido.

Por qué importa

Tres implicaciones concretas, ninguna especulativa.

Los SLA de parcheo dimensionados al ritmo antiguo ya están mal. Un SLA empresarial típico — 30 días para CVE críticos en activos expuestos a Internet — se negoció contra una base de unos pocos cientos de CVE por trimestre por proveedor. Si solo Chrome emite 6× más CVE YTD, el presupuesto de atención por bug colapsa. O el SLA se reduce o la cola crece. La propia formulación de VulnCheck: «Los defensores deben prepararse para mayores volúmenes mientras siguen usando threat intelligence para priorizar las amenazas activamente explotadas o probablemente explotables.»

La señal es asimétrica entre proveedores. Los socios de Glasswing (Apple, Mozilla, Microsoft, Google, Apache, AWS, Broadcom, Cisco, CrowdStrike, NVIDIA, JPMorgan, Linux Foundation, Palo Alto Networks, entre otros — véase la lista VulnCheck de CVE atribuidos a Anthropic) procesan hoy los bugs hallados con IA mediante divulgación coordinada. Los proveedores no socios aún no están en la misma curva. La brecha se cerrará — el Google Threat Intelligence Group ya ha documentado el uso de IA por adversarios para explotación de vulnerabilidades — pero por ahora el volumen se concentra donde también se parchea más rápido.

La carga de falsos positivos es un coste real. La proporción 1 de cada 5 de Stenberg en Curl es la cifra pública más clara hasta ahora. Para un mantenedor sin PSIRT dedicado, una avalancha de informes generados por IA — a menudo confiados, bien redactados y erróneos — es en sí un problema de relevancia: consume la misma atención humana que debería revisar los hallazgos reales. El equipo de seguridad de GitHub describió la misma dinámica entre muchos proyectos open source pequeños: ningún reportero supera el ~3 % del volumen, ningún proyecto el ~7 % — un cambio sistémico, no un único actor ruidoso.

Defensas

El manual defensivo trata sobre volumen, priorización y señal — no sobre un bug específico.

Re-calibre los SLA de parcheo al nuevo ritmo. Para motores de navegador (Chrome, Firefox, Safari) y pilas de servidor de alto volumen (Apache, VMware, F5), asuma que el ritmo de CVE creíbles aproximadamente se duplica o triplica en los próximos dos trimestres. Los activos expuestos a Internet en esas pilas deberían apuntar a SLA de 7-14 días para CVE críticos y altos; los ciclos diferidos necesitan una ruta explícita fuera de ciclo para los bugs listados en KEV.
Integre CISA KEV en su pipeline de priorización si aún no lo ha hecho. CVE-2026-34197 (ActiveMQ) pasó de la divulgación a KEV en cuestión de días. KEV sigue siendo la señal pública más limpia para «esto importa ahora», y es especialmente útil cuando los recuentos brutos de CVE se disparan.
Etiquete los CVE atribuidos a Glasswing como una cohorte aparte. VulnCheck publica una lista actualizada de CVE atribuidos a Anthropic. Etiquetarlos en su propia ingestión permite correlacionar qué clases de bugs surgen por IA frente a investigación clásica, y muestra dónde su stack de análisis estático queda superado en cobertura.
No corte HackerOne / bug bounty — fíltrelo. El reflejo del mantenedor es limitar los informes. La buena práctica, según GitHub y Curl, es un filtrado estructurado: exigir un repro funcional, campos de aviso legibles por máquina y un campo explícito de «herramientas IA usadas». La señal mejora con el tiempo; la peor fase fue enero-febrero de 2026.
Aplique el mismo flujo a su propio código. El patrón que Apache, Mozilla y Microsoft están usando públicamente — modelo de frontera que aflora candidatos, humano que tría, humano que redacta la divulgación — es reproducible sobre código interno con modelos públicos. No se necesita acceso de clase Mythos para las clases de bugs que dominan la ola actual (UAF, integer overflows, SSRF, path traversal, deserialización). Hágalo antes de que lo haga otro.
Modele la amenaza paralela del lado atacante. La nota de Google GTIG de mayo de 2026 deja claro que los adversarios también apuntan modelos de frontera a código. La ola defensiva de divulgaciones es la mitad controlada de la distribución. La mitad no controlada es el coste de no parchear lo bastante rápido.

Estado

Elemento	Referencia	Fecha	Notas
Análisis VulnCheck First CVE Wave	VulnCheck	2026-05-14	Top-20 CNA, base de 5 años, comparativa YTD 2026
Anuncio Project Glasswing	Anthropic	2026-04-07	Acceso restringido a Claude Mythos Preview para ~50 socios
Divulgación de seguridad IA de Mozilla	Mozilla Blog	2026-05-13	Confirma el uso de Mythos en Firefox desde febrero
Microsoft «Defense at AI Speed»	Microsoft Security Blog	2026-05-12	Sistema agéntico multi-modelo, retrospectiva CLFS
Revisión Mythos en Curl	daniel.haxx.se	2026-05-11	1 de 5 envíos Mythos confirmado como CVE real
CVE-2026-34197 ActiveMQ	Horizon3.ai / Apache	2026-05	«80 % Claude, 20 % humano», ya en CISA KEV

La primera ola de CVE no es una nueva clase de ataque. Es un cambio de volumen en producción — divulgación pública, con parches del proveedor incluidos, corriendo por delante del ritmo para el que estaban dimensionados los equipos defensivos. El trabajo es leer la ola por lo que es, recalibrar en consecuencia y evitar el error simétrico: ni descartar el volumen como ruido, ni tratar cada nuevo CVE como inmediatamente explotado.