Meta ha presentado la tercera generación de sus “Segment Anything Models” (SAM), un conjunto de herramientas de inteligencia artificial diseñadas para análisis visual avanzado. Si bien son distintos de los populares modelos de lenguaje grande Llama de Meta, estos nuevos sistemas representan un salto significativo en cómo las máquinas “ven” e interactúan con el mundo físico. SAM 3 se centra en la detección y segmentación precisa de objetos, lo que significa que puede identificar y aislar con precisión elementos dentro de imágenes y videos.
Cómo funciona SAM 3: comprensión visual precisa
A diferencia de los chatbots de IA, los modelos SAM destacan por reconocer objetos específicos, incluso en escenas complejas. Meta entrenó a SAM 3 en conjuntos de datos masivos de imágenes y videos combinados con descripciones de texto detalladas. Esto permite a la IA responder a solicitudes muy específicas: por ejemplo, seleccionar todos los elefantes en una foto o resaltar los “sombreros rojos” entre una multitud. La capacidad del modelo para interpretar consultas matizadas es su punto fuerte clave.
Estos modelos no sirven para crear nuevas imágenes o vídeos, sino para analizar contenido visual existente. Los desarrolladores pueden acceder a versiones de peso abierto a través de Segment Anything Playground de Meta. Sin embargo, el impacto real lo sentirán los usuarios cotidianos a través de mejoras en las propias plataformas de Meta.
Aplicaciones prácticas: de las redes sociales a la conservación de la vida silvestre
Meta está integrando SAM 3 en varios de sus productos:
- Ediciones y vibraciones de Instagram: Permite una edición por lotes más precisa de imágenes y videos.
- Facebook Marketplace: Mejora de la función “ver en una habitación”, lo que permite a los usuarios visualizar los muebles de sus hogares de manera más realista.
Más allá de las aplicaciones de consumo, SAM 3 está demostrando ser valioso en la investigación científica. Meta se asoció con ConservationX y Osa Conservation para analizar más de 10,000 horas de imágenes de cámaras de vida silvestre, identificando más de 100 especies con mayor precisión. Esto demuestra cómo la IA puede acelerar los esfuerzos de conservación al automatizar tediosos análisis de datos.
Estrategia de IA de Meta: ambición y desafíos internos
El desarrollo de modelos SAM es parte del impulso más amplio de Meta hacia la inteligencia artificial. La compañía invirtió mucho en la caza furtiva de los mejores talentos de IA a principios de este año, pero también enfrentó reveses internos. Informes recientes indican una reestructuración significativa dentro de la división de IA de Meta, incluidos despidos y la posible salida de una figura clave, Yann LeCun. A pesar de estos desafíos, Meta sigue comprometida a convertirse en líder en IA visual.
Estos avances en inteligencia visual probablemente cambiarán la forma en que interactuamos con el contenido digital, haciendo que la edición y el análisis sean más eficientes e intuitivos. Si bien las luchas internas de Meta son notables, el potencial del SAM 3 y modelos similares para impulsar la innovación tanto en el campo comercial como en el científico es innegable.






























