Meta ha presentato la terza generazione dei suoi “Segment Anything Models” (SAM), una suite di strumenti di intelligenza artificiale progettati per l’analisi visiva avanzata. Sebbene distinti dai popolari modelli linguistici Llama di Meta, questi nuovi sistemi rappresentano un passo avanti significativo nel modo in cui le macchine “vedono” e interagiscono con il mondo fisico. SAM 3 si concentra sul rilevamento e sulla segmentazione precisi degli oggetti, il che significa che può identificare e isolare accuratamente gli elementi all’interno di immagini e video.
Come funziona SAM 3: comprensione visiva precisa
A differenza dei chatbot AI, i modelli SAM eccellono nel riconoscere oggetti specifici, anche in scene complesse. SAM 3 con meta training su enormi set di dati di immagini e video abbinati a descrizioni di testo dettagliate. Ciò consente all’intelligenza artificiale di rispondere a richieste altamente specifiche: ad esempio, selezionando tutti gli elefanti in una foto o evidenziando i “cappelli rossi” in mezzo alla folla. La capacità del modello di interpretare query sfumate è il suo punto di forza.
Questi modelli non servono per creare nuove immagini o video, ma per analizzare i contenuti visivi esistenti. Gli sviluppatori possono accedere alle versioni a peso aperto tramite Segment Anything Playground di Meta. Tuttavia, l’impatto reale sarà avvertito dagli utenti di tutti i giorni attraverso i miglioramenti nelle piattaforme di Meta.
Applicazioni pratiche: dai social media alla conservazione della fauna selvatica
Meta sta integrando SAM 3 in molti dei suoi prodotti:
- Modifiche e vibrazioni di Instagram: abilitazione di modifiche batch più precise di immagini e video.
- Facebook Marketplace: miglioramento della funzione “visualizza in una stanza”, consentendo agli utenti di visualizzare i mobili nelle loro case in modo più realistico.
Oltre alle applicazioni di consumo, SAM 3 si sta rivelando prezioso nella ricerca scientifica. Meta ha collaborato con ConservationX e Osa Conservation per analizzare oltre 10.000 ore di riprese di telecamere sulla fauna selvatica, identificando oltre 100 specie con maggiore precisione. Ciò dimostra come l’intelligenza artificiale possa accelerare gli sforzi di conservazione automatizzando noiose analisi dei dati.
Strategia AI di Meta: ambizione e sfide interne
Lo sviluppo di modelli SAM fa parte della più ampia spinta di Meta verso l’intelligenza artificiale. L’azienda ha investito molto nella ricerca dei migliori talenti dell’IA all’inizio di quest’anno, ma ha anche dovuto affrontare battute d’arresto interne. Recenti rapporti indicano una significativa ristrutturazione all’interno della divisione AI di Meta, inclusi licenziamenti e la potenziale partenza di una figura chiave, Yann LeCun. Nonostante queste sfide, Meta continua a impegnarsi per diventare leader nell’intelligenza artificiale visiva.
Questi progressi nell’intelligenza visiva probabilmente rimodelleranno il modo in cui interagiamo con i contenuti digitali, rendendo la modifica e l’analisi più efficienti e intuitive. Sebbene le difficoltà interne di Meta siano notevoli, il potenziale di SAM 3 e di modelli simili nel promuovere l’innovazione sia in campo commerciale che scientifico è innegabile.





























