¿Avance o gran farol? La verdad detrás de la “peligrosa” nueva IA de Anthropic

16

La semana pasada, la industria tecnológica cayó en picada por un anuncio sorprendente de Anthropic: han desarrollado un modelo de inteligencia artificial tan poderoso en el ámbito de la ciberseguridad que se considera demasiado peligroso para su divulgación pública.

Apodado Claude Mythos Preview, el modelo es capaz de identificar miles de vulnerabilidades de alta gravedad en los principales sistemas operativos y navegadores web. Para gestionar este riesgo, Anthropic lanzó Proyecto Glasswing, una iniciativa a la que solo se puede acceder mediante invitación que permite a organizaciones seleccionadas probar el modelo y proteger su infraestructura digital.

Si bien el anuncio desencadenó debates de emergencia entre los líderes financieros y generó temores de piratería informática generalizada, persiste una pregunta central: ¿Es este un salto genuino en la capacidad de la IA o un truco de relaciones públicas calculado diseñado para estimular la inversión?

El caso de un truco publicitario: el “teatro corporativo”

Los críticos y escépticos argumentan que el enfoque de “la seguridad primero” de Anthropic tiene un doble propósito: proteger al público y construir una marca de poder indispensable.

  • Datos vagos: La ingeniera de seguridad de IA, Heidy Khlaaf, señala que Anthropic ha ocultado métricas críticas, como la tasa de “falsos positivos” y cuánta intervención humana fue necesaria para verificar los hallazgos del modelo. Sin estos datos, los expertos independientes no pueden validar las afirmaciones.
  • El “Marketing Flex”: Tal Kollender, director ejecutivo de la empresa de ciberseguridad Remedio, describe la medida como un “brillante teatro corporativo”. Al etiquetar el modelo como “demasiado peligroso para publicarlo”, Anthropic crea un aura de mística y señala un inmenso dominio tecnológico a los inversores.
  • Precedente histórico: Anthropic tiene un historial de emitir advertencias nefastas sobre sus propios modelos. Los escépticos señalan que algunos comportamientos “peligrosos” anteriores fueron en realidad el resultado de entornos de prueba artificiales altamente controlados en lugar de la intención de un modelo autónomo.

El caso de una amenaza genuina: una nueva escala de explotación

A pesar del escepticismo, pruebas independientes sugieren que Claude Mythos no es simplemente una exageración. El AI Security Institute (AISI) verificó recientemente que Mythos pasó pruebas de ciberseguridad que ningún otro modelo de frontera ha completado con éxito.

El peligro real no es necesariamente un “escenario de Hollywood” en el que un adolescente piratea una red eléctrica, sino más bien un cambio en la escala y velocidad de los ciberataques :

  1. Descubrimiento automatizado: A diferencia de las herramientas actuales, Mythos puede automatizar el descubrimiento de vulnerabilidades de “día cero” (fallas previamente desconocidas) a una escala sin precedentes.
  2. Explotación rápida: Los grupos de hackers sofisticados podrían utilizar estos modelos para encontrar y explotar debilidades más rápido de lo que los defensores humanos pueden repararlas.
  3. Capacidades probadas: El científico investigador Nicholas Carlini señaló que Mythos ya ha identificado vulnerabilidades en Linux que permiten el acceso administrativo no autorizado, lo que demuestra su potencia técnica.

El término medio: un arma de doble filo

Para muchos expertos, la respuesta no es “esto o lo otro”, sino ambas cosas. Es probable que Anthropic esté diciendo la verdad sobre el poder del modelo y al mismo tiempo utilice esa verdad para reforzar su posición en el mercado.

“Yo diría que son ambas cosas, y eso no es una crítica… Cualquier lanzamiento importante de una plataforma en esta era se verá diferente para diferentes audiencias dependiendo de su fluidez y su tolerancia al miedo”.
Howie Xu, director de IA e innovación de Gen

La realidad actual es una carrera armamentista asimétrica. Si bien Claude Mythos presenta un riesgo significativo para la seguridad, la misma tecnología proporciona una enorme ventaja a quienes defienden la frontera digital. A medida que la IA se vuelva más capaz de encontrar errores, las organizaciones encargadas de solucionarlos obtendrán herramientas igualmente poderosas para automatizar la defensa.


Conclusión: Claude Mythos representa un salto tecnológico genuino que automatiza el descubrimiento de vulnerabilidades digitales, pero el lanzamiento de alto riesgo de Anthropic es también una clase magistral en posicionamiento estratégico. El verdadero impacto estará determinado por si los defensores pueden utilizar estas mismas herramientas “peligrosas” para dejar atrás a los piratas informáticos.