Hardware Avanzado para Inteligencia Artificial

Los algoritmos de inteligencia artificial son cada vez más populares en diversas industrias y aplicaciones, pero su rendimiento suele estar limitado por la potencia de procesamiento de los procesadores tradicionales.

Para mejorar las capacidades de los algoritmos de IA, algunas empresas están desarrollando nuevas ofertas de hardware como unidades de procesamiento gráfico (GPU) y aceleradores de IA como las TPUs de Google. Estos nuevos procesadores pueden dar a los algoritmos de IA un impulso significativo de velocidad y permitir mejores resultados.

Alternativas de hardware optimizadas para IA

La unidad central de procesamiento (CPU) de una computadora es responsable de recibir y ejecutar instrucciones. Es el corazón del ordenador y su frecuencia de reloj determina qué tan rápido puede procesar cálculos.

Para tareas que requieren cálculos frecuentes o intensos, como los algoritmos de IA, se puede utilizar hardware especializado para mejorar la eficiencia. Este hardware normalmente no utiliza diferentes algoritmos o entradas, sino que está diseñado específicamente para manejar grandes cantidades de datos y proporcionar mayor potencia de cálculo.

Los algoritmos de IA suelen depender de procesadores que puedan realizar cálculos en paralelo, lo que permite crear nuevos modelos de IA más rápidamente. Esto es particularmente cierto con las unidades de procesamiento gráfico (GPU), que originalmente fueron diseñadas para cálculos gráficos pero han demostrado ser efectivas para muchas tareas de IA debido a las similitudes en las operaciones computacionales entre el procesamiento de imágenes y las redes neuronales. Para optimizar su rendimiento para IA, estos procesadores también pueden adaptarse para procesar eficientemente grandes cantidades de datos.

Hardware de IA para diferentes requisitos

Los requisitos de hardware para entrenar y utilizar algoritmos de IA pueden variar ampliamente. El entrenamiento, que implica reconocer patrones en grandes cantidades de datos, típicamente requiere más potencia de procesamiento y puede beneficiarse de la paralelización. Una vez que el modelo está entrenado, los requisitos computacionales pueden disminuir.

Para satisfacer estas necesidades variadas, algunos fabricantes de procesadores están desarrollando chips de inferencia de IA específicamente para ejecutar modelos entrenados, aunque los modelos completamente entrenados también pueden beneficiarse de arquitecturas paralelas.

Tradicionalmente, las PC tienen memoria y procesadores separados en su diseño. Sin embargo, los fabricantes de GPU han integrado memoria de alta velocidad directamente en la tarjeta para mejorar el rendimiento de los algoritmos de IA. Esto permite cargar y ejecutar modelos de IA intensivos en cálculos directamente en la memoria de la GPU, ahorrando tiempo en la transferencia de datos y acelerando los cálculos aritméticos.

Además de las CPU y GPU tradicionales, también existen chips de IA compactos diseñados para su uso en dispositivos como teléfonos inteligentes y sistemas de automatización. Estos chips pueden realizar tareas como el reconocimiento de voz de manera más eficiente y con menor consumo de energía. Algunos investigadores también están explorando el uso de circuitos eléctricos analógicos para el cálculo de IA, lo que ofrece el potencial de cálculos más rápidos, precisos y eficientes en energía en un espacio más reducido.

Ejemplos de hardware de IA

Las unidades de procesamiento gráfico, o GPU, siguen siendo el hardware de IA más común utilizado para el procesamiento, especialmente para tareas de aprendizaje automático. Debido a la ventaja mencionada anteriormente de la paralelización extensiva, las GPU suelen proporcionar cálculos varias cientos de veces más rápidos que las CPU.

A medida que la demanda de aprendizaje automático continúa creciendo, las empresas tecnológicas están desarrollando arquitecturas de hardware especializado que priorizan la aceleración de los algoritmos de aprendizaje de IA sobre las capacidades gráficas tradicionales.

Nvidia, líder del mercado en este campo, ofrece productos como los sistemas A100 y H100 que se utilizan en supercomputadoras en todo el mundo. Otras empresas, como Google, también están creando su propio hardware específicamente para aplicaciones de IA, con las Unidades de Procesamiento Tensorial (TPU) de Google ya en su cuarta generación.

Además de estos chips de IA generalizados, también existen chips especializados diseñados para partes específicas del proceso de aprendizaje automático, como el manejo de grandes cantidades de datos o su uso en dispositivos con espacio o vida útil de batería limitados, como los teléfonos inteligentes.

Por último, los procesadores tradicionales están orientados a manejar mejor las tareas de ML realizando cálculos a mayor velocidad, incluso si eso significa una disminución en la precisión. Finalmente, muchos proveedores de servicios en la nube también permiten que operaciones intensivas en cálculos se ejecuten en paralelo en múltiples máquinas y procesadores.

Principales empresas manufactureras de hardware de IA

La mayoría de las GPU para aprendizaje automático son producidas por Nvidia y AMD. Nvidia, por ejemplo, permite operaciones computacionales más precisas al entrenar modelos de ML utilizando los llamados "núcleos tensoriales".

Las tarjetas H100 también admiten la mezcla de diferentes precisiones con el Engine Transformer. AMD ofrece su propio enfoque para adaptar las GPU a las demandas del aprendizaje automático con las arquitecturas CDNA-2 y CDNA-3 que se lanzarán en 2023.

Google continúa liderando el camino en aceleración pura de ML con sus TPUs, disponibles para alquiler a través de la Plataforma de Google Cloud y acompañadas por una suite de herramientas y bibliotecas.

Google confía en las TPUs para todos sus servicios basados en aprendizaje automático, incluidos los de su línea de teléfonos inteligentes Pixel. Estas chips manejan localmente tareas como el reconocimiento de voz, la traducción en tiempo real y el procesamiento de imágenes.

Mientras tanto, otros grandes proveedores de la nube como Amazon, Oracle, IBM y Microsoft optaron por GPU u otro hardware de IA. Amazon incluso ha desarrollado sus propios chips Graviton, que priorizan la velocidad sobre la precisión. Aplicaciones front-end como Google Colab, Microsoft Machine Learning Studio, IBM Watson Studio y Amazon SageMaker permiten a los usuarios utilizar hardware especializado sin necesariamente ser conscientes de ello.

Startups innovadoras en chips de IA

Las startups también están entrando en el mercado de conjuntos de chips de IA, con empresas como California Matrix D que producen chips de computación en memoria (IMC) que aproximan cálculos aritméticos a datos almacenados en memoria.

Start Detach utiliza un método llamado "computación en memoria" para lograr una alta potencia de cálculo de dos petaops en una sola tarjeta inteligente. Este enfoque consiste en realizar cálculos directamente en las celdas de memoria.

Otras empresas, como Graphcore, Cerebras y Celestial, también están explorando la computación en memoria, diseños alternativos de chips y sistemas de lógica basados en luz para cálculos de IA más rápidos.