Минулого тижня технологічна індустрія була вражена несподіваною заявою компанії Anthropic: вони розробили модель штучного інтелекту, настільки потужну у сфері кібербезпеки, що її визнали надто небезпечною для публічного релізу.
Модель, що отримала назву Claude Mythos Preview, за наявними даними, здатна виявляти тисячі критичних уразливостей у найбільших операційних системах і веб-браузерах. Щоб мінімізувати ризики, Anthropic запустила Project Glasswing — закриту ініціативу, доступну лише на запрошення, яка дозволяє обраним організаціям тестувати модель та захищати свою цифрову інфраструктуру.
Хоча це оголошення викликало екстрені дискусії серед фінансових лідерів і породило побоювання з приводу масових хакерських атак, головне питання залишається відкритим: чи є це реальним стрибком у можливостях ІІ або ж це розважливий PR-хід, покликаний залучити інвестиції?
Аргументи на користь піару: «Корпоративний театр»
Критики та скептики стверджують, що підхід Anthropic «безпека насамперед» має подвійну мету: захист суспільства і створення іміджу бренду, який має незамінну силу.
- Нестача даних: Інженер з безпеки ІІ Хейді Кляаф зазначає, що Anthropic приховала найважливіші показники, такі як частота «хибнопозитивних результатів» та обсяг людського втручання, необхідного для перевірки висновків моделі. Без цих даних незалежні експерти не можуть підтвердити заяву компанії.
- «Маркетингова демонстрація сили»: Тал Коллендер, генеральний директор фірми з кібербезпеки Remedio, описує цей крок як «блискучий корпоративний театр». Називаючи модель «надто небезпечною для випуску», Anthropic створює ореол таємничості та демонструє інвесторам свою колосальну технологічну перевагу.
- Історичні прецеденти: У Anthropic вже була практика випуску тривожних попереджень про власні моделі. Скептики зауважують, що деякі попередні випадки «небезпечної» поведінки насправді були результатом роботи в контрольованих, штучних тестових середовищах, а не проявом автономного наміру моделі.
Аргументи на користь реальної загрози: Новий масштаб експлуатації
Незважаючи на скептицизм, незалежні випробування показують, що Claude Mythos – це не просто хайп. Інститут безпеки ІІ (AISI) нещодавно підтвердив, що Mythos успішно пройшов тести з кібербезпеки, з якими не впоралася жодна інша передова модель.
Реальна небезпека полягає не обов’язково в «голлівудському сценарії», де підліток зламує електромережу, а скоріше у зміні масштабу та швидкості кібератак :
- Автоматизоване виявлення: На відміну від існуючих інструментів, Mythos може автоматизувати пошук вразливостей «нульового дня» (раніше невідомих проломів) у безпрецедентних масштабах.
- Швидка експлуатація: Складні хакерські угруповання можуть використовувати подібні моделі для пошуку та використання слабких місць швидше, ніж фахівці із захисту встигнуть випустити виправлення (патчі).
- Доведені можливості: Дослідник Ніколас Карліні зазначив, що Mythos вже виявила вразливості в Linux, що дозволяють отримати несанкціонований адміністративний доступ, що доводить її технічний потенціал.
Золота середина: Двогострий меч
Для багатьох експертів відповідь не є вибором “або – або” – це і те, й інше одночасно. Anthropic, швидше за все, говорить правду про потужність моделі, але використовує цю правду для зміцнення своїх позицій на ринку.
«Я б сказав, що вірні обидва твердження, і це не критика… Будь-який масштабний запуск платформи в нашу епоху сприйматиметься різними аудиторіями по-різному, залежно від їхньої поінформованості та рівня терпимості до страху».
— Хоуї Сюй, директор з ІІ та інновацій у Gen
Поточна реальність — це асиметрична гонка озброєнь. Хоча Claude Mythos становить значний ризик для безпеки, та сама технологія дає величезну перевагу тим, хто захищає цифрові рубежі. У міру того, як ІІ стає все більш здатним знаходити баги, організації, відповідальні за їх усунення, отримають настільки ж потужні інструменти для автоматизації захисту.
Висновок: Claude Mythos є справжнім технологічним стрибком, що автоматизує пошук цифрових вразливостей, але й ризикований запуск проекту з боку Anthropic — це майстер-клас зі стратегічного позиціонування. Справжній ефект залежатиме від того, чи захисники зможуть використовувати ці ж «небезпечні» інструменти, щоб випередити хакерів.





























































