Meta zaprezentowała trzecią generację swoich „Segment Everything Models” (SAM), zestawu narzędzi AI przeznaczonych do zaawansowanej analizy wizualnej. W przeciwieństwie do popularnych, dużych modeli języka lamy opracowanych przez Meta, te nowe systemy stanowią znaczący postęp w sposobie, w jaki maszyny „widzą” i wchodzą w interakcję ze światem fizycznym. SAM 3 koncentruje się na precyzyjnym wykrywaniu i segmentacji obiektów, co oznacza, że może dokładnie identyfikować i izolować cechy na obrazach i filmach.
Jak działa SAM 3: precyzyjne zrozumienie wizualne
W przeciwieństwie do chatbotów AI, modele SAM przodują w rozpoznawaniu określonych obiektów, nawet w złożonych scenach. Meta przeszkoliła SAM 3 na ogromnych zbiorach danych zawierających obrazy i filmy powiązane ze szczegółowymi opisami tekstowymi. Dzięki temu sztuczna inteligencja może odpowiedzieć na bardzo szczegółowe zapytania: na przykład wybrać wszystkie słonie na zdjęciu lub zidentyfikować „czerwone kapelusze” w tłumie. Jego główną zaletą jest zdolność modelu do interpretowania zniuansowanych zapytań.
Modele te nie są przeznaczone do tworzenia nowych obrazów lub filmów, ale do analizowania istniejących treści wizualnych. Programiści mogą uzyskać dostęp do wersji z otwartymi ciężarami za pośrednictwem Meta’s Segment Everything Playground. Jednak prawdziwy wpływ odczują zwykli użytkownicy dzięki ulepszeniom własnych platform Meta.
Zastosowania praktyczne: od mediów społecznościowych po ochronę dzikiej przyrody
Meta integruje SAM 3 z kilkoma swoimi produktami:
- Edycja i wibracje na Instagramie: Umożliwia bardziej precyzyjną edycję zbiorczą zdjęć i filmów.
- Facebook Marketplace: Ulepszona funkcja „widoku pokoju”, umożliwiająca użytkownikom bardziej realistyczną wizualizację mebli w ich domach.
Oprócz zastosowań konsumenckich, SAM 3 okazuje się cenny w badaniach naukowych. Meta współpracowała z ConservationX i Osa Conservation, aby przeanalizować ponad 10 000 godzin materiału filmowego z kamer dzikiej przyrody, identyfikując z większą dokładnością ponad 100 gatunków. To pokazuje, jak sztuczna inteligencja może przyspieszyć wysiłki na rzecz ochrony przyrody, automatyzując żmudną analizę danych.
Strategia AI Meta: ambicje i wyzwania wewnętrzne
Rozwój modeli SAM jest częścią szerszych wysiłków Meta na rzecz sztucznej inteligencji. Na początku tego roku firma dużo zainwestowała w pozyskiwanie najlepszych talentów w zakresie sztucznej inteligencji, ale borykała się też z wewnętrznymi niepowodzeniami. Ostatnie raporty wskazują na znaczną restrukturyzację w dziale AI Meta, w tym zwolnienia i potencjalne odejście kluczowej postaci, Yanna LeCuna. Pomimo tych wyzwań Meta pozostaje zaangażowana w pozycję lidera w dziedzinie wizualnej sztucznej inteligencji.
Te postępy w inteligencji wizualnej prawdopodobnie zmienią sposób, w jaki wchodzimy w interakcję z treściami cyfrowymi, sprawiając, że edycja i analiza będą bardziej wydajne i intuicyjne. Chociaż wewnętrzne problemy Meta są zauważalne, potencjał SAM 3 i podobnych modeli w zakresie napędzania innowacji zarówno w dziedzinach komercyjnych, jak i naukowych jest niezaprzeczalny.





























