Microsoft levanta la tapa de los proyectos globales de infraestructura de IA

Microsoft levanta la tapa de los proyectos globales de infraestructura de IA

Microsoft ha revelado que está trabajando en un nuevo sistema de programación "planetario" para cargas de trabajo de IA, llamado Singularity.

Como se explica en un documento técnico publicado por la empresa, Singularity es un "nuevo programador consciente de la carga de trabajo que puede anticipar y escalar de manera elástica las cargas de trabajo de aprendizaje profundo para impulsar una alta utilización sin afectar su precisión o rendimiento a través de una sensación general de aceleradores de IA".

En términos no técnicos, esto significa que el sistema está diseñado para ayudar a garantizar que la red global de hardware de servidor de la empresa se utilice de manera óptima, reduciendo así los costos asociados con la ejecución de cargas de trabajo de IA.

singularidad de Microsoft

En el corazón de la propuesta de valor de Singularity se encuentra la capacidad de escalar trabajos a mitad de camino, así como moverlos entre diferentes instalaciones ubicadas en todo el mundo.

Como se explica en el documento, un trabajo en vivo puede migrarse a un clúster o centro de datos diferente y reanudarse en el punto exacto donde lo dejó, optimizando así la utilización de la capacidad. También se puede escalar hacia arriba o hacia abajo de manera elástica, aprovechando un número y tipo variable de aceleradores de IA según sea necesario.

La belleza de este sistema, según Microsoft, es que no requiere ningún trabajo adicional por parte de los desarrolladores, ya que no se requieren cambios de código para que Singularity funcione.

Sin embargo, para que todo esto fuera posible, Microsoft tuvo que encontrar una forma de desacoplar las cargas de trabajo de los recursos de hardware. La nueva solución utiliza algo que la empresa llama "proxy de dispositivo", que se ejecuta en su propio espacio de direcciones y establece una capa de separación que permite una reasignación fluida de recursos.

"Singularity logra un avance significativo en la planificación de cargas de trabajo de aprendizaje profundo, convirtiendo características de nicho como la elasticidad en características comunes y siempre activas en las que el planificador puede confiar para hacer cumplir los SLA estrictos", escribió Microsoft en su resumen.

“Con nuevos mecanismos que hacen que las tareas no modificadas sean prioritarias y redimensionables con una sobrecarga de rendimiento insignificante, Singularity permite niveles sin precedentes de fungibilidad de la carga de trabajo, lo que permite que las tareas aprovechen la capacidad disponible en cualquier parte de la flota distribuida globalmente”.

Aunque el servicio de programación es el enfoque principal del artículo, los autores afirman que el sistema está diseñado para escalar con una flota de cientos de miles de GPU y otros aceleradores de IA.

LaComparacion Pro le preguntó a Microsoft cuándo espera que Singularity esté disponible comercialmente.