DGX-1 “agrega” 400 servidores numa só máquina

O supercomputador da Nvidia deverá ser vendido por 149 mil dólares, a partir do terceiro trimestre.

Jen-Hsun Huang, CEO da Nvidia

Alimentado por unidades de GPU Volta, de alta potência, da Nvidia, o supercomputador DGX-1 permitirá a uma empresa prescindir de cerca de 400 servidores montados em rack. Curiosamente a máquina parece-se com aquele tipo de servidor, mas obtém a maior parte do seu poder de computação a partir de oito GPU Tesla V100.

Este componente , o primeiro baseado na nova arquitectura Volta, foi apresentada na última quarta-feira na GPU Technology Conference, em São Jose, na Califórnia. “Pode-se tirá-lo da caixa, ligá-lo e começar a trabalhar “, afirmou o CEO da Nvidia, Jen-Hsun Huang durante o seu discurso de abertura.

Mas o DGX-1 custa 149 mil dólares. Estará no mercado durante o terceiro trimestre embora o fabricante não tenha revelado se a disponibilidade será mundial.

O novo supercomputador traz tem 40960 núcleos CUDA, que a Nvidia diz equivalerem ao poder de computação de 800 CPU. Substitui o anterior DGX-1 baseado na actual arquitectura Pascal, que tem o poder de 250 servidores de dois sockets, de acordo com o fabricante.

Este diz ainda que o sistema é capaz de entregar cerca de 960 teraflops de desempenho, de meia precisão – vírgula flutuante de 16 bit – , o que significa menor precisão no desempenho de precisão singular e dupla. O desempenho de meia-precisão é considerado particularmente valioso para tarefas de aprendizagem automática.

O sistema pede 3200 watts de energia para funcionar, portanto não convém mantê-lo a funcionar o dia todo.

Mas acompanhando as GPU estão dois processadores Intel Xeon E5-2698 de 20 núcleos capazes de funcionar a velocidades de relógio de 2,2GHz. O sistema tem quatro SSD de 1,92 TB e é executado com Ubuntu Linux.

O sistema pede 3200 watts de energia para funcionar, portanto não convém mantê-lo a funcionar o dia todo. As GPU já suportam tarefas de aprendizagem automática em muitos centros de dados.

Mas o supercomputador da Nvidia é um exemplo de como as GPU estão a tornar reais, as aplicações de reconhecimento de imagens e processamento de linguagem natural. Huang argumenta que as CPU não fornecem poder suficiente de computação, especialmente para a inteligência artificial, área onde para a qual o executivo as GPU.

O Tesla V100 no DGX-1 é cinco vezes mais rápido do que a actual arquitectura Pascal, diz ainda. DEverá benficiar de novas tecnologias como a NVLink 2.0, uma nova interconexão com largura de banda de até 300Gbps.

A GPU tem mais de 21 mil milhões de transístores e 5120 núcleos. A largura de banda da sua memória HBM2 é de 900GBps (bytes por segundo) .

A Nvidia também incluiu na máquina um Tensor Core, núcleo que irá trabalhar com os mais regulares visando melhorar processos de aprendizagem profunda ou deep learning. O fabricante focou-se em estruturar os núcleos para acelerar as multiplicações de matriz, o cerne dos sistemas de deep learning.

120 teraflops e uma “estação de trabalho” 

A estrutura ajudará a alinhar os cálculos de vírgula flutuante de baixo nível, o que deve acelerá-los. Huang gabou-se de a GPU oferecer 120 teraflops de desempenho em processos de deep learning, embora isso seja difícil de verificar.

Não existem ferramentas padronizadas de benchmarking para aplicações de aprendizagem automática ou profunda, embora haja desenvolvimentos em empresas como a Google.

O supercomputador trabalha com computação de alto desempenho e matrizes de deep learning como a CUDA, Tensor e Caffe2.

A produtora de GPU também introduziu a DGX Station, uma versão menor do que o DGX-1. Parece mais uma estação de trabalho e tem quatro GPU Tesla V100. Mas tem o preço de 69 mil dólares e também estará disponível durante o terceiro trimestre.


Tags


Deixe um comentário

O seu email não será publicado