Intel supera a NVIDIA en lenguaje visual con Gaudí 2

Intel supera a NVIDIA en lenguaje visual con Gaudí 2

Noticias

Intel ha encontrado una ventaja frente a NVIDIA en el campo del lenguaje visual, una disciplina crucial en la visión por computadora y aplicaciones como la conducción autónoma. Esto se debe a una característica única de Intel Gaudí 2 en comparación con la H100 de NVIDIA, que compensa la diferencia en potencia bruta.

Gaudí 2 es el acelerador de IA de segunda generación desarrollado por Habana Labs, una empresa adquirida por Intel. En cuanto a potencia bruta para IA, es el diseño más poderoso de la compañía liderada por Pat Gelsinger, y no se trata de una GPU como los chips de NVIDIA, sino de un diseño creado específicamente para aplicaciones en inteligencia artificial.

Existe una disciplina en la que Gaudí 2 supera a la H100, que está relacionada con el lenguaje visual utilizado en el entrenamiento de IA generativas. Estas son aquellas en las que se describe un texto y la IA crea un dibujo basado en esa descripción, lo cual ha ganado popularidad con técnicas como Stable Diffusion o Midjourney. La ventaja de Gaudí 2 radica en su capacidad para procesar miles de imágenes para que la IA aprenda a identificar y dibujar objetos.

A diferencia de las GPU, que suelen tener aceleradores y decodificadores para tareas de vídeo e imagen, Gaudí 2 se ha diseñado específicamente para lenguaje visual. Esto le permite no solo decodificar formatos como HEVC, H.264, VP9 y JPEG, sino también realizar operaciones de postprocesamiento que en otros sistemas suelen recaer en el procesador central, creando un cuello de botella en el proceso.

Los resultados de benchmark han demostrado la superioridad de Gaudí 2 sobre H100 en el caso del BridgeTower, donde el acelerador de IA de Intel ha logrado un rendimiento 1.79 veces mayor que el de NVIDIA H100, y un salto de rendimiento de 2.23 veces en comparación con A100. Sin embargo, esta ventaja no se debe únicamente a la potencia bruta, sino a otros factores.

Si bien H100 domina actualmente el mercado y tiene una alta demanda, no es la única solución disponible y presenta limitaciones en ciertos modelos y aplicaciones de inteligencia artificial. El ejemplo de Gaudí 2 y el lenguaje visual demuestra que la potencia bruta no es la única solución para resolver ciertos algoritmos.

Es probable que las futuras generaciones de NVIDIA cuenten con coprocesadores adicionales para tareas recursivas y repetitivas en los procesos de aprendizaje e inferencia. Estos coprocesadores no aumentarán la potencia total en TFLOPS de los chips, pero acelerarán su trabajo en puntos específicos y mejorarán el rendimiento global en comparación con generaciones anteriores.

Definiciones:
– IA generativas: Modelos de inteligencia artificial que son capaces de generar contenido creativo, como imágenes, música o texto, a partir de una entrada específica.
– Lenguaje visual: Disciplina que se enfoca en la interpretación y creación de contenido visual utilizando técnicas de inteligencia artificial, como la generación de imágenes a partir de descripciones de texto.

Fuentes: No disponibles