Meta представила третє покоління своїх “Segment Anything Models” (SAM) – набір інструментів ІІ, призначених для просунутого візуального аналізу. На відміну від популярних великих мовних моделей Llama від Meta, ці нові системи знаменують собою значний стрибок у тому, як машини бачать і взаємодіють з фізичним світом. SAM 3 орієнтований на точне виявлення та сегментацію об’єктів, що означає, що він може точно ідентифікувати та ізолювати елементи на зображеннях та відео.
Як працює SAM 3: точне візуальне розуміння
На відміну від ІІ-чат-ботів, моделі SAM чудово розпізнають конкретні об’єкти, навіть у складних сценах. Meta навчила SAM 3 на великих наборах даних зображень і відео, зіставлених з детальними текстовими описами. Це дозволяє ІІ реагувати на високоспецифічні запити: наприклад, вибирати всіх слонів на фотографії або виділяти червоні капелюхи в натовпі. Здатність моделі інтерпретувати нюансовані запити — її головна перевага.
Ці моделі не призначені для створення нових зображень або відео, а для аналізу існуючого візуального контенту. Розробники можуть отримати доступ до версій з відкритою вагою через Segment Anything Playground від Meta. Однак реальний вплив відчують звичайні користувачі завдяки покращенням у власних платформах Meta.
Практичне застосування: від соціальних мереж до охорони дикої природи
Meta інтегрує SAM 3 у декілька своїх продуктів:
- Редагування та “вайби” в Instagram: забезпечення більш точного пакетного редагування зображень та відео.
- Facebook Marketplace: покращення функції “перегляду в кімнаті”, що дозволяє користувачам більш реалістично візуалізувати меблі у своїх будинках.
Крім споживчих програм, SAM 3 виявляється цінним у наукових дослідженнях. Meta співпрацювала з ConservationX та Osa Conservation для аналізу понад 10 000 годин відеозаписів з камер спостереження за дикою природою, ідентифікувавши понад 100 видів із більшою точністю. Це демонструє, як ІІ може прискорити зусилля збереження природи, автоматизуючи стомливий аналіз даних.
Стратегія Meta в галузі ІІ: амбіції та внутрішні труднощі
Розробка моделей SAM є частиною ширшого прагнення Meta до штучного інтелекту. Компанія вклала значні кошти у переманювання найкращих фахівців з ІІ на початку цього року, але також зіткнулася із внутрішніми невдачами. Нещодавні повідомлення вказують на значну реструктуризацію всередині підрозділу ІІ Meta, включаючи звільнення та потенційний догляд ключової фігури, Яна ЛеКуна. Незважаючи на ці труднощі, Meta, як і раніше, віддана лідерству в галузі візуального ІІ.
Ці досягнення в галузі візуального інтелекту, ймовірно, змінять те, як ми взаємодіємо з цифровим контентом, роблячи редагування та аналіз більш ефективними та інтуїтивними. Хоча внутрішні проблеми Meta помітні, потенціал SAM 3 та аналогічних моделей для стимулювання інновацій як у комерційних, так і в наукових галузях є незаперечним.






























































