, ,

Project Glasswing: Anthropic acaba de soltar una IA que encuentra bugs mejor que los humanos (y no piensa hacerla pública)

Glasswing
Avatar de Fernando Prada

Ha pasado algo que no debería pasar desapercibido.

Anthropic ha reunido a Amazon, Apple, Google, Microsoft, NVIDIA, CrowdStrike, Palo Alto Networks, Cisco, Broadcom, JPMorganChase y la Linux Foundation en una iniciativa conjunta de ciberseguridad. El nombre: Project Glasswing. El motivo: han desarrollado un modelo de IA, Claude Mythos Preview, que es tan bueno encontrando vulnerabilidades en software que han decidido no lanzarlo al público.

Lee eso otra vez. Una empresa de IA ha creado un modelo y ha decidido que es demasiado peligroso para ponerlo en manos de cualquiera. En vez de eso, lo ha puesto en manos de 12 de las empresas más grandes del mundo y unas 40 organizaciones adicionales que mantienen infraestructura crítica. Con $100 millones en créditos de uso y $4 millones en donaciones a proyectos open source.

No es un paper. No es un benchmark. Es un despliegue real, con nombres y apellidos.

Qué ha encontrado Mythos (y por qué asusta un poco)

Claude Mythos Preview no fue entrenado para ciberseguridad. Es un modelo de propósito general con capacidades fuertes de razonamiento y coding agéntico. Pero resulta que cuando un modelo es lo bastante bueno leyendo y razonando sobre código, encontrar agujeros de seguridad sale casi solo.

Mythos ha encontrado miles de zero-days en todos los sistemas operativos principales y todos los navegadores principales. No algunos. Todos.

Tres ejemplos que Anthropic ha publicado porque ya están parcheados:

Un bug de 27 años en OpenBSD. OpenBSD, el sistema operativo que se vende como el más seguro del mundo. El fallo permitía crashear cualquier máquina remotamente con solo conectarse a ella. Llevaba ahí desde 1999 y nadie lo había visto.

Un bug de 16 años en FFmpeg, la librería que usa básicamente todo el software del planeta para manejar vídeo. Herramientas de testing automatizado habían pasado por esa línea de código cinco millones de veces. Cinco millones. Mythos lo pilló a la primera.

Y una cadena de vulnerabilidades en el kernel de Linux que el modelo descubrió, conectó y explotó de forma completamente autónoma para pasar de usuario normal a control total de la máquina. Sin que nadie le dijera por dónde buscar.

Por qué Anthropic no lo hace público

Aquí es donde la cosa se pone interesante de verdad.

La decisión de no lanzar Mythos no es (solo) marketing. Anthropic dice que este modelo marca un punto de inflexión: es la primera vez que una IA compite con los mejores expertos humanos en encontrar y explotar vulnerabilidades de software. Y si esa capacidad llega a cualquiera sin control, el equilibrio entre ataque y defensa en ciberseguridad se rompe.

Piénsalo así. Hasta ahora, encontrar un zero-day requería meses de trabajo de un investigador muy especializado. Si un modelo puede hacer lo mismo en horas, de forma autónoma, el coste de atacar cae en picado pero el de defender sigue igual. Esa asimetría es la que Project Glasswing intenta corregir: poner las capacidades ofensivas al servicio de la defensa antes de que esas mismas capacidades se extiendan. Y Anthropic no se anda con rodeos: dice que modelos con capacidades similares van a proliferar en meses.

Lo que me cuadra, lo que me genera dudas, y lo que me parece más interesante

Microsoft está entre los partners. Igor Tsyganskiy, su EVP de Ciberseguridad, lo ha respaldado públicamente. Eso significa que Microsoft está reconociendo, al menos implícitamente, que un modelo de Anthropic pilla cosas que sus propias herramientas no detectan. En un sector con egos del tamaño de sus capitalizaciones bursátiles, eso no es menor.

El foco en open source también me parece acertado. La mayoría del software crítico del mundo se apoya en componentes open source que mantienen equipos pequeños, a veces una sola persona, sin acceso a herramientas de seguridad serias. Darles acceso a algo como Mythos podría cambiar esa dinámica. El CEO de la Linux Foundation lo puso en términos claros: la seguridad siempre ha sido un privilegio de quien puede pagar equipos grandes.

Ahora, la parte donde tengo dudas. Anthropic presenta esto como un acto de responsabilidad, y probablemente lo sea en parte. Pero también es una jugada comercial impecable. Decirle al mundo «nuestro modelo es tan potente que no podemos lanzarlo» posiciona a Mythos por encima de cualquier competidor sin que nadie necesite probarlo. Google participa en el proyecto, lo que sugiere que Gemini no llega a ese nivel. CrowdStrike y Palo Alto Networks, que viven de vender seguridad con IA propia, están admitiendo que esto les supera.

No digo que sea puro humo. Los zero-days son reales, los parches son reales, los benchmarks son públicos. Pero «demasiado peligroso para publicar» resulta ser también la mejor campaña de lanzamiento que se le puede ocurrir a nadie.

Qué significa esto si trabajas con Azure o Microsoft Foundry

Si Microsoft está metiendo Mythos Preview en sus operaciones de seguridad, es cuestión de tiempo que los beneficios bajen a los servicios que usamos. Azure, Defender, los endpoints de Foundry. No mañana, pero tampoco dentro de cinco años.

Hay otra lectura más inmediata. Si estás construyendo agentes o sistemas de IA en Azure, el código que generan esos agentes tiene vulnerabilidades. Las tiene siempre. Una herramienta capaz de revisar ese código al nivel de Mythos no es un extra. Es algo que necesitamos y que todavía no existe de forma accesible.

Y luego están los agentes autónomos. Si tienes agentes que toman decisiones, ejecutan herramientas y modifican sistemas, la superficie de ataque crece con cada agente que añades. Project Glasswing no resuelve eso directamente, pero apunta la dirección: proteger sistemas de IA va a requerir IA. No hay suficientes personas.

¿Qué debemos esperar?

Dentro de 90 días Anthropic publicará un informe con resultados concretos. Veremos si los números sostienen la narrativa. Mientras tanto, lo que hoy está en manos de 40 organizaciones selectas acabará llegando al resto de la industria de una forma u otra.

Si tu trabajo tiene algo que ver con software, seguridad o infraestructura cloud, esto te va a afectar. La pregunta no es si estos modelos van a cambiar la ciberseguridad. Es si cuando lleguen a tu puerta vas a estar del lado de los que se prepararon o del lado de los que pensaron que era hype.

Avatar de Fernando Prada

Deja una respuesta