IBM lançou novo processador com inteligência artificial acelerada

Para a indústria em geral, uma das principais dinâmicas é a computação acelerada. Praticamente todas as novas tecnologias, desde smartphones a servidores em nuvem, utilizam blocos de processamento personalizados ou programáveis para executar tarefas de forma mais eficiente do que o CPU de propósito geral.

A IBM começou a desenhar um novo processador para o mainframe IBM Z, um dos principais topos de gama da tecnologia que ainda utiliza chips concebidos para segurança, fiabilidade e escalabilidade de negócios. O novo processador, Telum, tentará melhorar estes aspetos adicionando aceleração integrada de inteligência artificial (IA), conforme anunciado pela empresa na sua conferência anual Hot Chips, que é confirmado pela Forbes.

O Telum tem oito núcleos de CPU, aceleradores de carga de trabalho no chip, e 35 megabytes do que a IBM chama de cache semiprivado. Cada módulo terá duas matrizes para um total de 16 núcleos. Isto cria uma arquitetura diferencial em comparação com a geração anterior, que tinha 12 núcleos e um chip separado para uma cache partilhada. O Telum será fabricado com o processo de sete nm da Samsung, ao contrário do processador z15 de 14n. O processador também tem memória encriptada e melhorias fiáveis do ambiente de execução para aumentar a segurança. Também possui aceleradores dedicados no chip para classificação, compressão, encriptação e IA para escalar com a carga de trabalho. Um estudo interno da organização mostra que para 90% dos inquiridos, é importante ser capaz de construir e executar projetos de IA onde quer que os seus dados residam. “Com a Telum, o acelerador está próximo de dados e aplicações críticos da missão”, disse a empresa. As principais inovações, como explicam, poderiam vir dos sectores bancário, financeiro, comercial e segurador. Especificamente, na deteção de fraudes.

A mudança de processador mais significativa está na estrutura da cache. Cada núcleo CPU tem uma cache L1 dedicada e 32 megabytes de baixa latência semiprivada cache L2. A razão para esta semiprivacidade é que os caches L2 são usados juntos para construir um L3 virtual compartilhado de 256 megabytes entre os núcleos do chip. A arquitetura cache foi combinada com melhorias nos núcleos de CPU e aceleradores. Os núcleos de CPU do Telum são complicados com rosca múltipla simultânea (SMT2) que pode funcionar numa frequência base de 5 GHz ou superior.

Para a IBM e para a indústria em geral, uma das principais dinâmicas é a computação acelerada. Praticamente todas as novas tecnologias, desde smartphones a servidores em nuvem, utilizam blocos de processamento personalizados ou programáveis para executar tarefas de forma mais eficiente do que o CPU de propósito geral. Isto porque é mais eficiente executar tarefas através de hardware dedicado do que software. Além disso, o abrandamento da Lei de Moore significa que, à medida que se torna cada vez mais difícil melhorar o desempenho e a eficiência da CPU, a indústria caminha para melhorias mais heterogéneas. Ao conceber núcleos de processamento mais eficientes, um desempenho significativamente melhorado pode ser alcançado na mesma quantidade de espaço ou similar. Como resultado, o curso da indústria é através da computação acelerada. De acordo com a própria empresa, a nova estrutura cache resultou num aumento de desempenho de cerca de 40%.




Deixe um comentário

O seu email não será publicado