redaccion@diariodigitalis.com

Facebook investiga una IA capaz de ver, escuchar y recordar las acciones del usuario

Un nuevo proyecto de investigación dirigido por el equipo de inteligencia artificial de Facebook da a entender el alcance de las ambiciones de la compañía. El proyecto imagina sistemas de inteligencia artificial que analizan constantemente la vida de las personas utilizando vídeos en primera persona, registrando lo que ven, hacen y oyen para ayudarlas con las tareas diarias.

Los investigadores de Facebook han delineado una serie de habilidades que quiere que desarrollen estos sistemas, incluida la «memoria episódica» (respondiendo preguntas como «¿dónde dejé mis llaves?») y la «diarización audiovisual» (recordando quién dijo qué y cuándo).

Facebook no piensa de momento en su aplicación comercial

En este momento, las tareas anteriormente mencionadas no se pueden lograr de manera segura con ningún sistema de inteligencia artificial, y Facebook enfatiza que este es un proyecto de investigación en lugar de un desarrollo comercial. Sin embargo, está claro que la empresa ve funcionalidades como estas como el futuro de la computación de realidad aumentada.

«Definitivamente, pensando en la realidad aumentada y en lo que nos gustaría poder hacer con ella, hay posibilidades en el futuro de aprovechar este tipo de investigación», declaró a The Verge la científica de investigación de inteligencia artificial de Facebook, Kristen Grauman.

Tales ambiciones tienen enormes implicaciones en la privacidad. Los expertos en privacidad ya están preocupados por cómo las gafas de realidad aumentada de Facebook permiten a los usuarios grabar de forma encubierta a miembros del público. Estas preocupaciones solo se agravarán si las versiones futuras del hardware no solo registran las imágenes, sino que las analizan y transcriben, convirtiendo a los usuarios en máquinas de vigilancia ambulantes.

Un conjunto de datos de 855 personas de todo el mundo

El nombre del proyecto de investigación de Facebook es Ego4D, que se refiere al análisis de vídeos en primera persona o «egocéntricos». Este consta de dos componentes principales: un conjunto de datos abierto de vídeo egocéntrico y una serie de puntos de referencia que Facebook cree que los sistemas de inteligencia artificial deberían poder abordar en el futuro.

Id bootcamps Banner

El conjunto de datos es el más grande de su tipo jamás creado, y Facebook se asoció con 13 universidades de todo el mundo para recopilar los datos. En total, 855 participantes que viven en nueve países diferentes grabaron unas 3.205 horas de metraje. Las universidades, y no Facebook, fueron las responsables de recopilar los datos. Los participantes, algunos de los cuales recibieron una remuneración, usaron cámaras GoPro y gafas de realidad aumentada para grabar vídeos de sus actividades sin ningún guion.

Esto abarca desde trabajos de construcción hasta repostería, jugar con mascotas y socializar con amigos. Todas las imágenes fueron «desidentificadas» por las universidades, lo que incluyó difuminar los rostros de los transeúntes y eliminar cualquier información de identificación personal.

Grauman dice que el conjunto de datos es «el primero de su tipo tanto en escala como en diversidad». El proyecto comparable más cercano, dice, contiene 100 horas de metraje en primera persona filmado en su totalidad en cocinas. «Hemos abierto los ojos de estos sistemas de inteligencia artificial a más que solo cocinas en el Reino Unido y Sicilia, sino [a imágenes de] Arabia Saudita, Tokio, Los Ángeles y Colombia».

Artículos Relacionados

Suscríbete a nuestra newsletter


(Obligatorio)

También te puede gustar

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

Suscríbete a nuestra newsletter