CerteroCertero
← Inicio
Mercado relacionadotecnologia
Will DeepSeek have the top AI model at the end of June 2026?
Vol COP 248,212 COP · CPMM
1¢
No
99¢
NoticiaComtugatech.com.pt

AMD Acelera Instinct MI355X em 75 Vezes no DeepSeek V4 Pro com ROCm | TugaTech

  1. TugaTech»Hardware»Noticias de Hardware

LoginRegistar|

  • Fórum
  • Portal
  • Host
  • Procurar
  • Membros
  • Registar
  • Login

Últimos assuntos

  • »Garmin lança atualização para smartwatches premium com 38 novas correções

Hoje à(s) 10:25 porDJPRMF

  • »Novos chips Qualcomm Dragonwing transformam routers em centrais multimédia com IA

Hoje à(s) 10:23 porDJPRMF

  • »Preço dos combustíveis volta a subir mas o governo trava o impacto

Hoje à(s) 10:18 porDJPRMF

  • »Spotify investe na geração de conteúdos artificiais e arrisca afastar utilizadores

Hoje à(s) 10:16 porDJPRMF

  • »Estudo da NASA revela a melhor tática para intercetar comunicações alienígenas

Hoje à(s) 10:11 porDJPRMF

  • »Criadores do NotebookLM encerram aplicação Huxe face à pressão das grandes tecnológicas

Hoje à(s) 10:09 porDJPRMF

  • »Record Club é a nova rede para organizar e registar tudo o que ouves

Hoje à(s) 9:17 porDJPRMF

  • »Atalho no Windows junta todas as definições e ferramentas numa única janela

Hoje à(s) 9:05 porDJPRMF

  • »Nova atualização do HyperOS 3 corrige falhas irritantes nos telemóveis da Xiaomi

Hoje à(s) 8:58 porDJPRMF

  • »Trabalhadores da Microsoft e Meta disparam os custos da IA com consumo extremo

Hoje à(s) 8:56 porDJPRMF

  • »Novo Tails 7.8 reforça a segurança e diz adeus ao Thunderbird

Ontem à(s) 22:10 porDJPRMF

  • »Novo navegador Vivaldi 8.0 transforma o design e ignora a inteligência artificial

Ontem à(s) 21:53 porDJPRMF

  • »Infomaniak transfere direitos para fundação para proteger privacidade e independência

Ontem à(s) 21:52 porDJPRMF

  • »Stability AI lança Stable Audio 3.0 para criar músicas até seis minutos

Ontem à(s) 21:51 porDJPRMF

  • »Nitrux 6.1.0 chega com novo kernel Linux e otimizações de desempenho

Ontem à(s) 21:50 porDJPRMF

  • »Google AI Studio chega aos telemóveis com versão Android e pré-registo no iOS

Ontem à(s) 21:49 porDJPRMF

  • »Conceito para o Explorador de Ficheiros resolve limitações do Windows 11

Ontem à(s) 21:48 porDJPRMF

  • »Stellantis e Qualcomm reforçam parceria para criar carros com processadores Snapdragon

Ontem à(s) 21:44 porDJPRMF

  • »Rádio Popular alvo de alegado ataque com exposição de dados de clientes

Ontem à(s) 20:37 porDJPRMF

  • »Produção de ecrãs OLED para o novo MacBook Pro arranca já em junho

Ontem à(s) 19:49 porDJPRMF

Siga-nos

Siga no Google NotíciasInscreva-se na newsletterApoie com um café

TugaTech»Hardware»Noticias de Hardware»AMD Acelera Instinct MI355X em 75 Vezes no DeepSeek V4 Pro com ROCm

AMD Acelera Instinct MI355X em 75 Vezes no DeepSeek V4 Pro com ROCm

Publicado em 12/05/2026

A inteligência artificial generativa continua a consolidar-se como a grande revolução tecnológica desta década, partilhando o mesmo patamar de impacto que a própria criação da Internet. Se o mercado global assiste a uma verdadeira corrida ao ouro com investimentos avultados no setor, o ano de 2026 está a marcar o ponto em que o hardware atinge novos limites de eficiência.

Segundo revelou a análise da SemiAnalysis na rede social X, uma equipa de engenieros da AMD conseguiu um feito notável em apenas 14 dias: otimizar a plataforma de software ROCm para que o acelerador Instinct MI355X registe um salto de desempenho de 75 vezes na execução do modelo DeepSeek V4 Pro.

Enquanto muitas organizações ainda procuram rentabilizar as suas infraestruturas de IA, as fabricantes de silício continuam a capitalizar com a enorme procura. A NVIDIA mantém a liderança destacada das receitas globais, mas a AMD mostra agora que a otimização de software pode encurtar a distância no processamento dos modelos de código aberto mais avançados do mercado.

O Salto Exponencial em Duas Semanas

O progresso registado pela equipa da AMD traça uma linha de evolução surpreendente para o processamento de grandes modelos de linguagem. No dia 25 de abril de 2026, o acelerador MI355X apresentava dificuldades evidentes a correr o DeepSeek V4 Pro, ficando-se por uns modestos 80 tokens por segundo em cada GPU.

No entanto, o cenário mudou radicalmente no início de maio. No dia 2, a primeira grande otimização elevou o registo para mais de 500 tokens por segundo, ultrapassando a fasquia dos 600 tokens logo dois dias depois. O culminar deste esforço concentrado chegou a 8 de maio, com o hardware a atingir a marca dos 1.500 tokens por segundo por GPU.

De acordo com os dados partilhados, a chave para esta otimização profunda esteve na combinação estratégica de operações mHC e na fusão de transformações _Hadamard RoPE_. Esta abordagem técnica permitiu reduzir substancialmente a sobrecarga do processador central e maximizar a largura de banda da memória HBM integrada no acelerador.

O Domínio da NVIDIA e a Resposta do Silício Chinês