Революционную силу Интернета довольно сложно измерить количественно, но для некоторых даже доступ к основам довольно сложен. Слепые и слабовидящие люди часто взаимодействуют с Интернетом с помощью средств чтения с экрана, которые читают содержимое страницы вслух.

К сожалению, средства чтения с экрана msot полагаются на замещающий текст (или альтернативный текст) и другую скрытую информацию, чтобы правильно выполнять свою работу, и разработчики иногда могут упускать из виду эти более мелкие важные детали.

Чтобы помочь, Microsoft анонсировала новые функции для своего браузера Edge, которые автоматически добавляют замещающий текст к изображениям, у которых еще нет замещающего текста, что, как надеется компания, сделает Интернет более доступным.

«Когда программа чтения с экрана встречает изображение без тегов, это изображение может быть автоматически обработано алгоритмами машинного обучения (ML) для описания изображения словами и захвата любого содержащегося в нем текста», — говорит Трэвис Лейтхед из Microsoft. «Алгоритмы несовершенны, а описания меняются по качеству, но для пользователей программ чтения с экрана наличие описания для изображения обычно лучше, чем полное отсутствие контекста».

Надеемся, что обновление устранит проблему чтения с экрана «графики без тегов» каждый раз, когда изображение не имеет замещающего текста.

Доступность Microsoft Edge

Очевидно, что эта технология основана на облачной платформе Azure компании. Microsoft Edge отправит любое непомеченное изображение в системы машинного зрения Azure, которые затем автоматически создадут альтернативный текст на английском, испанском, японском, португальском или упрощенном китайском языке.

Некоторые изображения, например изображения размером менее XNUMX x XNUMX пикселей, содержащие порнографию, запекшуюся кровь или материалы сексуального характера, а также изображения очень большого размера, к сожалению, не будут отправлены на анализ.

В настоящее время Microsoft вносит изменения Edge в Windows, macOS и Linux и планирует добавить их в iOS и Android позднее.

«Эта функция все еще новая, и мы знаем, что еще не закончили», — говорит Лейтхед. «Мы уже нашли способы дальнейшего улучшения этой функциональности, например, когда у изображений есть тег, но этот тег на самом деле не полезен (например, тег «изображение» или «изображение» или родственный омоним избыточны с очевидным ). Прогрессивное распознавание изображений и усовершенствования алгоритмов также помогут улучшить качество обслуживания».

Поделиться