Meta mejora la IA multimodal de sus gafas RayBan para reconocer lugares de interés y ofrecer información sobre ellos
Meta anunció la mejora de las capacidades de Inteligencia Artificial (IA) multimodal de las gafas Ray-Ban Stories. Ahora pueden reconocer lugares y puntos de referencia para dar datos sobre ellos.
La firma lanzó las Ray-Ban Stories, desarrolladas junto con la marca de gafas Ray-Ban, primero en Estados Unidos en septiembre de 2021.
COMPATIBILIDAD CON OTROS SERVICIOS DE META
Este dispositivo cuenta con funciones de cámara dual de 5 MP y vídeo, además de que viene con audio incorporado para escuchar música y realizar llamadas.
También es compatible con algunos de los servicios que desarrolla la propia Meta, como WhatsApp -para enviar mensajes encriptados de punto a punto o escuchar las respuestas de audio.
También será compatible con Facebook View.
NUEVAS CAPACIDADES DE IA MULTIMODAL A PRUEBA
La compañía anunció a finales de 2023 la integración de su asistente de asistente Meta AI en una nueva generación de sus gafas.
En este lanzamiento, se combina la comprensión del lenguaje con la visión computacional para ver el mundo desde la perspectiva del usuario.
En esa línea, se comentó que estaba probando nuevas capacidades de IA multimodal para permitir traducir un idioma de un texto que esté leyendo el usuario o crear un título para una foto.
RECONOCER PUNTOS POPULARES
La firma indicó ahora que mejoró la IA multimodal de este dispositivo para que sea capaz de reconocer puntos de referencia “populares” y obtener información sobre ellos.
Así lo comentó en Threads el director de Tecnología de Meta, Andrew Bosworth.
Esto significa que, por ejemplo, al situarse con las gafas inteligentes frente al puente Golden Gate de San Francisco (Estados Unidos), el usuario obtiene información sobre él.
META REALIZA UNA ACTUALIZACIÓN PERIÓDICA
Esta mejora forma parte de una versión beta, aunque la firma espera que esté disponible “para más personas” próximamente.
En este sentido, la empresa ha abierto una lista de espera en la que pueden apuntarse aquellos que estén interesados en experimentar con esta función.
Por otro lado, el directivo comentó que, más allá de las mejoras enfocadas al apartado de IA multimodal, Meta está actualizando periódicamente la experiencia general de manos libres.
CONFIGURAR LA VELOCIDAD DE REPRODUCCIÓN
Avanza en este sentido mediante el agregado de comandos de voz para compartir su última interacción de Meta AI en WhatsApp, Messenger y mensajes de texto.
También será posible configurar en el apartado de Voz la velocidad de reproducción de los pódcast, para que Meta AI pueda leerlos a un ritmo más lento o más rápido.
Conviene recordar que también en 2023 la compañía reconoció, antes de la llegada de la segunda generación, que del total de sus compradores, tan solo un 10 por ciento las utiliza habitualmente.
Fuente: EP.