IBM ha presentado su primera supercomputadora nativa de la nube optimizada para Inteligencia Artificial (IA), una tecnología con la flexibilidad necesaria para implementar «fácilmente» una infraestructura de esta envergadura similar en cualquier centro de datos IBM Cloud en todo el mundo.
La empresa tecnológica estadounidense ha evidenciado que los modelos de IA se incluyen cada vez más en aspectos de la vida cotidiana y, sobre todo, de la vida laboral, con modelos más complejos y nuevas técnicas que necesitan más poder de computación para satisfacer esta demanda de IA.
Las supercomputadoras son «sistemas compuestos por muchos elementos informáticos poderosos que trabajan juntos para resolver grandes problemas con alto rendimiento». Como explican desde IBM, se utilizan para entrenar los modelos de IA en un amplio conjunto de datos, normalmente modelos masivos que superan en algunos casos los miles de millones de parámetros.
Sin embargo, IBM también ha resaltado en un comunicado compartido en su blog que las supercomputadoras tradicionales no fueron diseñadas para desarrollar IA y, aunque funcionan bien para ello, el diseño tradicional requiere opciones tecnológicas que «aumentan los costes y limitan la flexibilidad de implementación».
Teniendo todo esto en cuenta, IBM ha desarrollado Vela, su supercomputadora nativa de la nube y optimizada especialmente para el desarrollo de IA, con la que ha conseguido flexibilidad para implementarla en cualquiera de sus centros y abaratar costes, ya que utiliza infraestructura existente y, simplemente, asigna los recursos a través de ‘software’.
Según ha detallado la compañía, este proyecto lleva activo desde mayo del pasado año alojado en IBM Cloud y, por el momento, su uso está destinado únicamente a la comunidad de IBM Research, convirtiéndose en el «entorno de referencia» para los investigadores y para crear capacidades de IA más avanzadas.
IBM ha explicado que al optar por el desarrollo de la supercomputadora en la nube, han sacrificado una parte de su rendimiento pero, a cambio, la productividad se amplía considerablemente.
Esto se debe a que la supercomputadora nativa de la nube permite que se configure todo lo necesario a través de software, así como utilizar una interfaz de programación (API) «sólida y establecida» y, por tanto, un ecosistema de servicios más amplio.
Igualmente, posibilita aprovechar los conjuntos de datos que residen en Cloud Object Store de IBM, por lo que no es necesario construir un servidor de almacenamiento propio.
Siguiendo esta línea, la compañía también ha explicado que puede aprovechar su capacidad de red de nube privada virtual (VPC) para colaborar con socios «utilizando prácticas de seguridad avanzada».
En cuanto a la reducción de capacidad de rendimiento que supone la nube, IBM ha subrayado que tras «una cantidad significativa de investigación y descubrimiento» consiguieron que la sobrecarga de virtualización sea más baja, inferior al 5 por ciento, exponiendo todas las capacidades del nodo, es decir GPU, CPU, redes y almacenamiento, en la máquina virtual (VM).
Por otra parte, la composición de los nodos de la supercomputadora para IA incluye una gran memoria GPU con una capacidad de 80GB y una memoria de almacenamiento local en el nodo de 1,5TB de memoria dinámica de acceso aleatorio (DRAM) junto con cuatro unidades de memoria no volátil rápida (NVMe) de 3,2TB. Todo ello, en base a la intención de utilizar Vela para entrenar modelos grandes de IA.
Además, cada nodo tiene dos procesadores Intel Xenon de segunda generación. Vela también incorpora las soluciones NVLink y NvSwitch para conectar entre sí las ocho unidades de procesamiento gráfico A100 de 80GB que se disponen en cada nodo.
IBM ha indicado que compartirán más información sobre las próximas mejoras tanto en la productividad como en el rendimiento del usuario final que facilitarán «los sistemas emergentes y las innovaciones de software».
Fuente: notimerica.com