En las últimas pruebas de la industria de MLPerf, la plataforma de IA de NVIDIA elevó el listón para el entrenamiento de IA y la informática de alto rendimiento.
Entre muchos nuevos récords y hitos, uno destaca en la IA generativa: NVIDIA Eos, un superordenador de IA alimentado por 10.752 GPU NVIDIA H100 Tensor Core y la red NVIDIA Quantum-2 InfiniBand, completó una prueba de entrenamiento basada en un modelo GPT-3 con 175 mil millones de parámetros entrenados en mil millones de tokens en tan solo 3,9 minutos.
Este logro marca un aumento de casi 3 veces desde los 10,9 minutos, el récord establecido por NVIDIA cuando se introdujo la prueba hace menos de seis meses.
La aceleración en el tiempo de entrenamiento reduce costos, ahorra energía y acelera el tiempo de lanzamiento al mercado. Esta capacidad impulsa ampliamente la disponibilidad de los modelos de lenguaje grandes para que todas las empresas puedan adoptarlos con herramientas como NVIDIA NeMo, un marco para personalizar los modelos de lenguaje.
En una nueva prueba de IA generativa en esta ronda, 1.024 GPU de la arquitectura NVIDIA Hopper completaron una prueba de entrenamiento basada en el modelo Stable Diffusion de texto a imagen en 2,5 minutos, estableciendo un alto estándar en esta nueva carga de trabajo.
El uso de estas dos pruebas por parte de MLPerf refuerza su liderazgo como el estándar de la industria para medir el rendimiento de la IA, dado que la IA generativa es la tecnología más transformadora de nuestro tiempo.