GTC | NVIDIA lança GPUs Blackwell com 30x mais poderosas


Nesta segunda-feira (18), a NVIDIA lançou na GTC 2024 (Graphics Technology Conference) as novas GPU B200 para IA, inaugurando a arquitetura Blackwell. As novas GPUs trazem inovações de hardware e de tecnologias embarcadas que entregam, por GPU, 4 vezes mais desempenho em treinamento, 30 vezes mais em inferências e 25 vezes mais eficiência energética em relação aos chips Hopper H100.

Os novos chips Blackwell são fabricados em processo de 4 nm da TSMC 4NP, adaptado para integrar dois dies Blackwell para atuarem como uma única GPU por meio de interconectores chip-para-chip (NVLINK C2C) de 10 TB/s. A grande vantagem do novo design é eliminar eventuais problemas de comportamento de programas em arquitetura desagregada de chiplets.

Continua após a publicidade

Inferência na escala de trilhões de parâmetros

Outra inovação dos chips Blackwell é a introdução da nova geração de Núcleos Tensor e compiladores Tensor combinando modelos TensorRT-LLM e framework NeMo Megatron. Entre outras vantagens, o resultado é uma aceleração de inferência e treinamento em tempo real na escala de 10 trilhões de parâmetros.

Além disso, a NVIDIA lançou a quinta geração de interconectores NVIDIA NVLink com largura de banda bidirecional de 1,8 TB/s, garantindo comunicação de altíssima velocidade entre até 576 GPUs. Com a implementação de um motor de descompressão dedicado, os chips B200 ainda oferecem ganhos significativos de desempenho em atividades de análise de dados.

Continua após a publicidade

Servidores NVL72 com superchip

Por fim, o maior destaque da nova arquitetura de GPUs da NVIDIA fica para o superchip Grace-Blackwell GB200, evolução dos já impressionantes Grace-Hopper, implementados nos servidores NVL72. A nova geração de racks NVIDIA para IA e HPC combina 36 CPUs Amazing Grace e 72 GPUs Blackwell B200 em comunicação pela quinta geração do NVIDIA NVLink.

O resultado é um servidor com poder computacional de 720 Petaflops (PFLOPs) em treinamento de modelos LLM, 1.440 PFLOPs em inferência e capacidade para modelos de até 27 trilhões de parâmetros. A NVIDIA já conta com um portfólio vasto de empresas que vão adotar as soluções Blackwell ainda em 2024.

Continua após a publicidade

Entre as principais parcerias estão Google Cloud, Microsoft Azure, Oracle Cloud Infrastructure e Amazon Web Services (AWS) como primeiras a atualizarem suas infraestruturas. Além disso, Cisco, Dell, Lenovo e Supermicro também vão produzir suas próprias soluções de servidores utilizando chips Blackwell e outras tecnologias NVIDIA também para 2024.



Source link

Leave a Comment