AWS e NVIDIA estendem parceria em IA generativa

Empresas anunciaram a ampliação de sua parceria estratégica

continua depois da publicidade

A Amazon Web Services (AWS) e a NVIDIA anunciaram a ampliação de sua parceria estratégica para entregar os mais avançados serviços, infraestrutura e software capazes de acelerar as inovações de Inteligência Artificial (IA) generativa a seus clientes.

As empresas juntarão as tecnologias da NVIDIA e da AWS – desde os mais novos sistemas NVIDIA multinós com GPUs, CPUs e software de IA de última geração até a virtualização e segurança do AWS Nitro System, a interconexão do Elastic Fabric Adapter (EFA) e a escalabilidade do UltraCluster, ideais para o treinamento de modelos fundacionais e a construção de aplicações de IA generativa.

Os principais serviços anunciados foram:

  • Novas instâncias Amazon EC2

A AWS será o primeiro provedor de cloud a oferecer os Superchips NVIDIA GH200 Grace Hopper com a tecnologia multinós NVLink na nuvem.

A plataforma conecta 32 Superchips Grace Hopper às tecnologias NVIDIA NVLink e NVSwitch em uma instância e estará disponível no Amazon Elastic Compute Cloud (Amazon EC2), conectada com os dispositivos de rede da AWS (EFA), suportados por virtualização avançada (AWS Nitro System) e clustering de hiperescala (Amazon EC2 Ultraclusters), permitindo que clientes conjuntos escalem para milhares de Superchips GH200.

As instâncias AWS com GH200 NVL32 darão aos clientes acesso sob demanda para desempenho de nível de supercomputador, algo crítico para cargas de trabalho de IA/ML em larga escala, que precisem ser distribuídas ao longo de múltiplos nós para complexas cargas de trabalho de IA generativa – incluindo FMs (modelos fundacionais), sistemas de recomendação e bancos de dados vetoriais.

continua depois da publicidade

  • AWS é a primeira a hospedar a NVIDIA DGX Cloud rodando o Grace Hopper

A AWS irá hospedar a NVIDIA DGX Cloud, plataforma de treinamento em IA como serviço, proporcionando às organizações acesso rápido à supercomutação multinós e acelerando o treinamento dos mais complexos LLMs e modelos de IA generativa, com o software NVIDIA AI Enterprise integrado e acesso direto aos especialistas em IA da NVIDIA – oferecendo aos desenvolvedores a maior memória compartilhada em uma única instância, capaz de chegar a mais de 1 trilhão de parâmetros.

  • Desenvolvimento de IA na NVIDIA

A NVIDIA e a AWS estão colaborando no Projeto Ceiba para desenvolver o mais rápido supercomputador de IA baseado em GPU, sistema em escala com GH200 NVL32 e interconexão Amazon EFA.

O primeiro supercomputador desse tipo – com 16.384 Superchips NVIDIA GH200 e capaz de processar 65 exaflops de IA – será utilizado para impulsionar a próxima onda de inovação em IA generativa. O supercomputador será integrado a serviços da AWS como a solução de rede criptografada Amazon Virtual Private Cloud (VPC) e o serviço de storage de alta performance Amazon Elastic Block Store.

A NVIDIA utilizará o supercomputador para avançar em IA para LLMs, gráficos e simulação, biologia digital, robótica, carros autônomos, previsão do clima no Earth 2 e muito mais.

  • Desenvolvimento de IA generativa, HPC, design e simulação

A fim de estimular o desenvolvimento, o treinamento e a inferência dos maiores LLMs, as instâncias P5e da AWS utilizarão a mais recente GPU H200 da NVIDIA para oferecer 141 GB de memória GPU HBM3e, que é 1,8x maior e 1,4x mais rápida do que as GPUs H100.

A AWS também anunciou novas instâncias Amazon EC2 G6e com GPUs NVIDIA L40S e instâncias G6 com GPUs L4 para entregar soluções com eficiência energética para cargas de trabalho de gráficos, IA e vídeo.

As instâncias G6 foram construídas para lidar com cargas de trabalho complexas, como IA generativa e aplicações de gêmeos digitais.

Com o NVIDIA Omniverse é possível desenvolver, contextualizar e aprimorar simulações 3D realistas utilizando dados em tempo real.

  • Software NVIDIA na AWS acelera o desenvolvimento de IA generativa

O software NVIDIA na AWS está ajudando a Amazon a trazer mais inovações aos seus serviços e operações. A AWS está usando o framework NVIDIA NeMO para treinar LLMs Amazon Titans selecionados.

O Amazon Robotics começou a usar o NVIDIA Omniverse Isaac para construir gêmeos digitais para automatizar, otimizar e planejar seus centros de distribuição autônomos em ambientes virtuais antes de implementá-los no mundo real.

O NVIDIA BioNeMO, disponível agora no Amazon SageMaker e planejado para ser oferecido na AWS por meio do NVIDIA DGX Cloud, permite que empresas farmacêuticas acelerem o descobrimento de medicamentos ao simplificar e acelerar o treinamento de modelos utilizando seus próprios dados.