Microsoft ha introducido una nueva función en su navegador web, Microsoft Edge, que permitirá a los usuarios con problemas de visión conocer el contenido de las imágenes mediante un texto alternativo que el sistema reproduce con voz.
La compañía ha puesto en marcha esta nueva función con el objetivo de crear una experiencia más inclusiva y accesible, para que los usuarios puedan comprender el contenido completo de una página web.
Se trata de un sistema basado en Inteligencia Artificial (IA) que genera automáticamente un texto alternativo que describe el significado de una imagen o lo que aparece en ella.
Generalmente, las imágenes que se integran en páginas web cuentan con un texto que describe brevemente el contenido de estas y mejora la comprensión de su significado o su contexto.
Sin embargo, Microsoft ha explicado a través del blog de Microsoft Edge que "más de la mitad de las imágenes de las webs carecen de texto alternativo" y que la mayoría de ellas son reconocidos por el navegador como gráficos sin etiquetar, por lo que los usuarios con problemas de visión no pueden comprender su información.
Por ese motivo, ha desarrollado una tecnología con la que, mediante algoritmos de aprendizaje automático o 'machine learning', se puedan describir con palabras estas imágenes, así como el texto que estas contengan.
De ese modo, si en la sección de noticias de una página web existe una fotografía y está sobrepuesto el título del artículo, la descripción automática de Microsoft Edge será capaz de revelar tanto lo que aparece en la imagen como el título de la noticia.
Microsoft ha reconocido que el algoritmo no es perfecto y, por eso, inicia todas las descripciones de las imágenes con "Parece ser" y de los textos con "Parece decir".
Este sistema no es automático, sino que los usuarios deberán activarlo desde el apartado de 'Accesibilidad', disponible en el menú de Configuración. Una vez dentro, deberán elegir 'Obtener descripciones de imágenes de Microsoft para lectores de pantalla'.
Cuando esta configuración esté habilitada, aparecerá un mensaje con un resumen de la función y un enlace a información adicional sobre la privacidad. Además, solicitará el permiso del usuario para continuar.
Una vez los usuarios hayan otorgado los premisos necesarios al navegador, Microsoft Edge enviará las imágenes sin etiquetas de texto alternativo a la API Computer Vision de Azure Cognitive Services para su procesamiento.
Se admiten todos los formatos de imagen web disponibles, como JPEG, PNG, GIF, WEBP, etc. Además, la API de Vision puede analizar imágenes y crear descripciones hasta en cinco idiomas (inglés, español, japonés, portugés y chino), así como reconocer texto dentro de imágenes en más de 120 idiomas.
Este sistema, en cambio, no es capaz de generar los subtítulos de imágenes que cuenten con la etiqueta de 'Decorativas' en la página web, que son aquellas que solo se han introducido para dar mayor atractivo a una página.
Tampoco puede leer las imágenes de menos de 50 x 50 píxeles, es decir, aquellas que tienen un tamaño pequeño, como un icono, ni tampoco las que sean excesivamente grandes.
Por último, Microsoft ha informado de que tampoco se pueden describir mediante texto alternativo aquellas que hayan sido clasificadas por Vision API como de naturaleza pronográfica, sangrientas o sexualmente sugerentes.
La compañía ha anunciado finalmente que este servicio está disponible para todos los clientes de Microsoft Edge en Windows, Mac y Linux. Sin embargo, esta función aún no ha llegado a dispositivos iOS y Android.
Fuente EP.