Calidad de llamada mejorada de Google Duo para usuarios con Internet lento que utilizan IA

Calidad de llamada mejorada de Google Duo para usuarios con Internet lento que utilizan IA

Es poco probable que alguien haya logrado evitar los servicios de videollamadas o llamadas de voz que dependen de las conexiones a Internet en este momento, gracias en gran parte a la pandemia mundial. Existe una posibilidad aún menor de que esas llamadas estuvieran completamente libres de interrupciones, fallas, latencia y otros artefactos disruptivos, pero los últimos avances de la división de inteligencia artificial de Google deberían ayudar en ese frente. Como se publicó en el blog de Google AI, el equipo desarrolló un nuevo códec de audio llamado Lyra, específicamente destinado a comprimir el habla a una tasa de bits más baja. A solo 3 kbps (es decir, kilobits por segundo), Lyra usa significativamente menos datos que el códec más utilizado en la actualidad: el opus de código abierto, que "logra una calidad de voz transparente e indistinguible. Del original" a 32 kbps pero que se puede operar a tasas más bajas. De hecho, en estudios de Google, se encontró que el códec Opus que funciona a 8 kbps es menos preferible que Lyra a 3 kbps, que es una reducción del 60% en el ancho de banda.

Google Duo

En la publicación del blog, Google AI anunció que "actualmente está implementando Lyra para mejorar la calidad y confiabilidad de las llamadas de audio en conexiones de muy bajo ancho de banda ". Por lo tanto, si es un usuario de Google Duo en Android o iOS y tiene conexiones a Internet deficientes o inconsistentes, pronto verá una mejora significativa en la calidad y estabilidad de las llamadas. No hay una mención específica de cuándo el códec estará ampliamente disponible, pero es probable que sea una actualización entre bastidores, por lo que es posible que no sea de gran utilidad. Pump cuando aterrice.

AI y el futuro

Los avances de Lyra están impulsados ​​por la combinación de la tecnología de códec existente de Google AI y los "avances en el aprendizaje automático con modelos entrenados durante miles de horas de datos". Estos datos incluyen hablantes en más de 70 idiomas, disponibles de forma gratuita en bibliotecas de código abierto, para garantizar su aplicación universal. El blog en sí profundiza mucho más en los detalles de cómo este aprendizaje automático permitió la nueva tecnología, así como el uso de fragmentos de audio para demostrar la diferencia entre el audio original, Lyra y el audio de otros códecs a diferentes velocidades de bits. El equipo planea continuar optimizando Lyra, mejorando su calidad y confiabilidad con la esperanza de que sea adoptado fuera de la aplicación Google Duo. Esto probablemente signifique que otras aplicaciones y servicios de VOIP y videoconferencia se beneficiarán del códec en el futuro. Además, la publicación también afirma que el equipo también está "comenzando a investigar cómo estas tecnologías pueden llevar a un códec de audio versátil de baja tasa de bits", lo que podría significar casos de uso sin voz, como música y música. Otros sonidos podrían ver las mismas mejoras .