
AMD Acelera Instinct MI355X em 75 Vezes no DeepSeek V4 Pro com ROCm | TugaTech
- TugaTech»Hardware»Noticias de Hardware
LoginRegistar|
- Fórum
- Portal
- Host
- Procurar
- Membros
- Registar
- Login
Últimos assuntos
- »Garmin lança atualização para smartwatches premium com 38 novas correções
Hoje à(s) 10:25 porDJPRMF
- »Novos chips Qualcomm Dragonwing transformam routers em centrais multimédia com IA
Hoje à(s) 10:23 porDJPRMF
- »Preço dos combustíveis volta a subir mas o governo trava o impacto
Hoje à(s) 10:18 porDJPRMF
- »Spotify investe na geração de conteúdos artificiais e arrisca afastar utilizadores
Hoje à(s) 10:16 porDJPRMF
- »Estudo da NASA revela a melhor tática para intercetar comunicações alienígenas
Hoje à(s) 10:11 porDJPRMF
- »Criadores do NotebookLM encerram aplicação Huxe face à pressão das grandes tecnológicas
Hoje à(s) 10:09 porDJPRMF
- »Record Club é a nova rede para organizar e registar tudo o que ouves
Hoje à(s) 9:17 porDJPRMF
- »Atalho no Windows junta todas as definições e ferramentas numa única janela
Hoje à(s) 9:05 porDJPRMF
- »Nova atualização do HyperOS 3 corrige falhas irritantes nos telemóveis da Xiaomi
Hoje à(s) 8:58 porDJPRMF
- »Trabalhadores da Microsoft e Meta disparam os custos da IA com consumo extremo
Hoje à(s) 8:56 porDJPRMF
- »Novo Tails 7.8 reforça a segurança e diz adeus ao Thunderbird
Ontem à(s) 22:10 porDJPRMF
- »Novo navegador Vivaldi 8.0 transforma o design e ignora a inteligência artificial
Ontem à(s) 21:53 porDJPRMF
- »Infomaniak transfere direitos para fundação para proteger privacidade e independência
Ontem à(s) 21:52 porDJPRMF
- »Stability AI lança Stable Audio 3.0 para criar músicas até seis minutos
Ontem à(s) 21:51 porDJPRMF
- »Nitrux 6.1.0 chega com novo kernel Linux e otimizações de desempenho
Ontem à(s) 21:50 porDJPRMF
- »Google AI Studio chega aos telemóveis com versão Android e pré-registo no iOS
Ontem à(s) 21:49 porDJPRMF
- »Conceito para o Explorador de Ficheiros resolve limitações do Windows 11
Ontem à(s) 21:48 porDJPRMF
- »Stellantis e Qualcomm reforçam parceria para criar carros com processadores Snapdragon
Ontem à(s) 21:44 porDJPRMF
- »Rádio Popular alvo de alegado ataque com exposição de dados de clientes
Ontem à(s) 20:37 porDJPRMF
- »Produção de ecrãs OLED para o novo MacBook Pro arranca já em junho
Ontem à(s) 19:49 porDJPRMF
Siga-nos
Siga no Google NotíciasInscreva-se na newsletterApoie com um café
TugaTech»Hardware»Noticias de Hardware»AMD Acelera Instinct MI355X em 75 Vezes no DeepSeek V4 Pro com ROCm
AMD Acelera Instinct MI355X em 75 Vezes no DeepSeek V4 Pro com ROCm
Publicado em 12/05/2026
A inteligência artificial generativa continua a consolidar-se como a grande revolução tecnológica desta década, partilhando o mesmo patamar de impacto que a própria criação da Internet. Se o mercado global assiste a uma verdadeira corrida ao ouro com investimentos avultados no setor, o ano de 2026 está a marcar o ponto em que o hardware atinge novos limites de eficiência.
Segundo revelou a análise da SemiAnalysis na rede social X, uma equipa de engenieros da AMD conseguiu um feito notável em apenas 14 dias: otimizar a plataforma de software ROCm para que o acelerador Instinct MI355X registe um salto de desempenho de 75 vezes na execução do modelo DeepSeek V4 Pro.
Enquanto muitas organizações ainda procuram rentabilizar as suas infraestruturas de IA, as fabricantes de silício continuam a capitalizar com a enorme procura. A NVIDIA mantém a liderança destacada das receitas globais, mas a AMD mostra agora que a otimização de software pode encurtar a distância no processamento dos modelos de código aberto mais avançados do mercado.
O Salto Exponencial em Duas Semanas
O progresso registado pela equipa da AMD traça uma linha de evolução surpreendente para o processamento de grandes modelos de linguagem. No dia 25 de abril de 2026, o acelerador MI355X apresentava dificuldades evidentes a correr o DeepSeek V4 Pro, ficando-se por uns modestos 80 tokens por segundo em cada GPU.
No entanto, o cenário mudou radicalmente no início de maio. No dia 2, a primeira grande otimização elevou o registo para mais de 500 tokens por segundo, ultrapassando a fasquia dos 600 tokens logo dois dias depois. O culminar deste esforço concentrado chegou a 8 de maio, com o hardware a atingir a marca dos 1.500 tokens por segundo por GPU.
De acordo com os dados partilhados, a chave para esta otimização profunda esteve na combinação estratégica de operações mHC e na fusão de transformações _Hadamard RoPE_. Esta abordagem técnica permitiu reduzir substancialmente a sobrecarga do processador central e maximizar a largura de banda da memória HBM integrada no acelerador.
O Domínio da NVIDIA e a Resposta do Silício Chinês
…

