Con sus ambiciones de Metaverse en ruinas, Meta ahora está buscando a AI para impulsar su próxima etapa de desarrollo. Uno de los últimos proyectos de Meta, anunció el gigante de las redes sociales el miércoles, se llama Segment Anything Model.
Segment Anything ayuda a los usuarios a identificar elementos específicos en una imagen con unos pocos clics. Mientras aún está en modo de demostración, la compañía dice Segmentar cualquier cosa ya puede tomar una foto e identificar individualmente los píxeles que componen todo en la imagen para que uno o más elementos se puedan separar del resto de la imagen.
Meta entrando en calor con SAM
Segment Anything Model (SAM) es un sistema de segmentación que se puede solicitar. Puede “recortar” cualquier objeto, en cualquier imagen, con un solo clic.
Las máscaras se pueden rastrear en videos, habilitar aplicaciones de edición de imágenes e incluso elevarse a 3D
🧵Recorrido rápido y prueba pic.twitter.com/YC0JSWYy9X
— Nick St. Pierre (@nickfloats) 5 de abril de 2023
“La segmentación, que identifica qué píxeles de imagen pertenecen a un objeto, es una tarea central en la visión por computadora y se utiliza en una amplia gama de aplicaciones, desde el análisis de imágenes científicas hasta la edición de fotos”, escribió Meta en una publicación que anuncia el nuevo modelo.
Meta dijo que crear un modelo de segmentación preciso para tareas específicas requiere un trabajo altamente especializado por parte de expertos técnicos con acceso a la infraestructura de capacitación de IA y grandes volúmenes de datos en el dominio cuidadosamente anotados.
“Logramos una mayor generalización que los enfoques anteriores al recopilar un nuevo conjunto de datos de un tamaño sin precedentes”. Ross Girshick, científico investigador de Meta, dijo descifrar en un correo electrónico. “De manera crucial, en este conjunto de datos, no restringimos los tipos de objetos que anotamos.
“Gracias a la escala de los datos y su generalidad, nuestro modelo resultante muestra capacidades impresionantes para manejar tipos de imágenes que no se vieron durante el entrenamiento, como imágenes centradas en el ego, microscopía o fotos submarinas”, agregó Girshick.
La inteligencia artificial generativa es un sistema de IA que genera texto, imágenes u otros medios en respuesta a indicaciones. Algunos de los ejemplos más destacados de esta tecnología son ChatGPT de OpenAI y la plataforma de arte digital Midjourney.
Meta dice que el sistema Segment Anything AI fue entrenado en más de 11 millones de imágenes. Como explicó Girshick, Meta está poniendo a disposición de la comunidad de investigación Segment Anything bajo una licencia abierta permisiva, Apache 2.0, a la que se puede acceder a través de la Segmentar cualquier cosa Github.
“Un aspecto clave de las leyes de privacidad es que la recopilación de datos debe realizarse de manera transparente y con el pleno consentimiento del individuo”, dijo Lyle Solomon, abogado principal de Oak View Law Group. descifrar. “El uso de IA para el reconocimiento facial sin consentimiento expreso plantea dudas sobre posibles violaciones de la ley de privacidad. Además, las empresas deben evitar compartir datos faciales con terceros a menos que la persona haya dado su consentimiento, y cualquier intercambio debe cumplir con las disposiciones de la ley de privacidad”.
Girshick dice que Segment Anything está en su fase de investigación y no tiene planes de usarlo en producción. Aún así, existen preocupaciones relacionadas con la privacidad en los usos potenciales de la inteligencia artificial.
En febrero, Meta cambió sus planes de lanzar un metaverso para centrarse en otros productos, incluida la inteligencia artificial, y anunció la creación de un nuevo grupo de productos centrado en la IA generativa. proyecto.
Los líderes mundiales, cansados del avance de la inteligencia artificial, expresaron su preocupación y abrieron investigaciones sobre la tecnología y lo que significa para la privacidad y seguridad del usuario después del lanzamiento de ChatGPT de OpenAI. Italia ya prohibió el popular chatbot.
“Muchos usuarios no entienden cómo funciona este proceso o cuáles pueden ser las consecuencias a largo plazo si su rostro se usa para entrenar un modelo de aprendizaje automático sin su consentimiento”. kristen rubipresidente de la consultora de inteligencia artificial y redes sociales Ruby Media Group, dijo descifrar.
“El mayor desafío que tienen muchas empresas es obtener acceso a datos de capacitación a gran escala, y no hay mejor fuente de datos de capacitación que la que las personas brindan en las redes sociales”, dijo.
Ruby sugiere verificar si una empresa ha incluido una cláusula de aprendizaje automático que informe a los usuarios cómo se utilizan sus datos y si pueden optar por no participar en futuros modelos de capacitación. Ella señala que muchas empresas actualmente tienen una configuración predeterminada de suscripción voluntaria, pero que puede cambiar a optar por no participar en el futuro.
“Hemos empleado varias técnicas para preservar la privacidad, como rostros borrosos y otra información de identificación personal (por ejemplo, placas de matrícula)”, dijo Girshick. “Los usuarios pueden informarnos sobre contenido ofensivo enviando un correo electrónico a segment-anything@meta.com con la identificación de la imagen, y la eliminaremos del conjunto de datos”.