Прорыв или масштабный блеф? Вся правда о «опасном» новом ИИ от Anthropic

2

На прошлой неделе технологическая индустрия была потрясена неожиданным заявлением компании Anthropic: они разработали модель искусственного интеллекта, настолько мощную в сфере кибербезопасности, что её признали слишком опасной для публичного релиза.

Модель, получившая название Claude Mythos Preview, по имеющимся данным, способна выявлять тысячи критических уязвимостей в крупнейших операционных системах и веб-браузерах. Чтобы минимизировать риски, Anthropic запустила Project Glasswing — закрытую инициативу, доступную только по приглашениям, которая позволяет избранным организациям тестировать модель и защищать свою цифровую инфраструктуру.

Хотя это объявление вызвало экстренные дискуссии среди финансовых лидеров и породило опасения по поводу массовых хакерских атак, главный вопрос остается открытым: является ли это реальным скачком в возможностях ИИ или же это расчетливый PR-ход, призванный привлечь инвестиции?

Аргументы в пользу пиара: «Корпоративный театр»

Критики и скептики утверждают, что подход Anthropic «безопасность прежде всего» преследует двойную цель: защиту общества и создание имиджа бренда, обладающего незаменимой мощью.

  • Недостаток данных: Инженер по безопасности ИИ Хейди Кляаф отмечает, что Anthropic скрыла важнейшие показатели, такие как частота «ложноположительных результатов» и объем человеческого вмешательства, необходимого для проверки выводов модели. Без этих данных независимые эксперты не могут подтвердить заявления компании.
  • «Маркетинговая демонстрация силы»: Тал Коллендер, генеральный директор фирмы по кибербезопасности Remedio, описывает этот шаг как «блестящий корпоративный театр». Называя модель «слишком опасной для выпуска», Anthropic создает ореол таинственности и демонстрирует инвесторам свое колоссальное технологическое превосходство.
  • Исторические прецеденты: У Anthropic уже была практика выпуска тревожных предупреждений о собственных моделях. Скептики замечают, что некоторые предыдущие случаи «опасного» поведения на самом деле были результатом работы в строго контролируемых, искусственных тестовых средах, а не проявлением автономного намерения модели.

Аргументы в пользу реальной угрозы: Новый масштаб эксплуатации

Несмотря на скептицизм, независимые испытания показывают, что Claude Mythos — это не просто хайп. Институт безопасности ИИ (AISI) недавно подтвердил, что Mythos успешно прошел тесты по кибербезопасности, с которыми не справилась ни одна другая передовая модель.

Реальная опасность заключается не обязательно в «голливудском сценарии», где подросток взламывает электросеть, а скорее в изменении масштаба и скорости кибератак :

  1. Автоматизированное обнаружение: В отличие от существующих инструментов, Mythos может автоматизировать поиск уязвимостей «нулевого дня» (ранее неизвестных брешей) в беспрецедентных масштабах.
  2. Быстрая эксплуатация: Сложные хакерские группировки могут использовать подобные модели для поиска и использования слабых мест быстрее, чем специалисты по защите успеют выпустить исправления (патчи).
  3. Доказанные возможности: Исследователь Николас Карлини отметил, что Mythos уже обнаружила уязвимости в Linux, позволяющие получить несанкционированный административный доступ, что доказывает её технический потенциал.

Золотая середина: Обоюдоострый меч

Для многих экспертов ответ не является выбором «или — или» — это и то, и другое одновременно. Anthropic, скорее всего, говорит правду о мощности модели, но при этом использует эту правду для укрепления своих позиций на рынке.

«Я бы сказал, что верны оба утверждения, и это не критика… Любой масштабный запуск платформы в нашу эпоху будет восприниматься разными аудиториями по-разному, в зависимости от их осведомленности и уровня терпимости к страху».
Хоуи Сюй, директор по ИИ и инновациям в Gen

Текущая реальность — это асимметричная гонка вооружений. Хотя Claude Mythos представляет значительный риск для безопасности, та же самая технология дает огромное преимущество тем, кто защищает цифровые рубежи. По мере того как ИИ становится всё более способным находить баги, организации, ответственные за их устранение, получат столь же мощные инструменты для автоматизации защиты.


Заключение: Claude Mythos представляет собой подлинный технологический скачок, автоматизирующий поиск цифровых уязвимостей, но и рискованный запуск проекта со стороны Anthropic — это мастер-класс по стратегическому позиционированию. Истинный эффект будет зависеть от того, смогут ли защитники использовать эти же «опасные» инструменты, чтобы опередить хакеров.