AMD equipa os modelos de IA GPT-OSS 20B e 120B da OpenAI com Ryzen e Radeon: Ryzen AI MAX+ 395 é o único chip de IA a suportar o modelo 120B com um extraordinário pool de memória de 128 GB

AMD equipa os modelos de IA GPT-OSS 20B e 120B da OpenAI com Ryzen e Radeon: Ryzen AI MAX+ 395 é o único chip de IA a suportar o modelo 120B com um extraordinário pool de memória de 128 GB

A OpenAI revelou seus modelos de IA mais recentes, o GPT-OSS 20B e o GPT-OSS 120B, e a AMD está na vanguarda dessa inovação. A empresa anunciou suporte completo para esses modelos por meio de suas GPUs Ryzen AI MAX e Radeon, permitindo que os usuários aproveitem recursos avançados e melhorias de desempenho.

APU Ryzen AI MAX+ 395 da AMD: uma revolução para o GPT-OSS 120B da OpenAI

Com a introdução dos novos modelos de IA da OpenAI, a AMD posicionou suas CPUs Ryzen AI e GPUs Radeon como o hardware ideal para desempenho ideal. Especificamente, a APU Ryzen AI MAX+ 395 é destacada como o chip exclusivo capaz de executar o modelo GPT-OSS 120B nativamente, além de oferecer suporte ao Day-0, permitindo que os usuários experimentem os modelos imediatamente via LM Studio.

AMD Ryzen AI Max+ aproveitando o GPT-OSS 120B da OpenAI com suporte a MCP para processamento aprimorado.

O que são exatamente esses novos modelos? A série GPT-OSS compreende modelos de peso aberto capazes de realizar raciocínio abrangente e tarefas de agente. Embora muitos chips e PCs de IA consigam lidar com a versão 20B, o modelo 120B, mais exigente, exige recursos de hardware significativos.É aqui que as arquiteturas Ryzen AI MAX e Strix Halo da AMD se destacam, com até 128 GB de memória que atendem especificamente a essa funcionalidade avançada de IA.

Explorando recursos avançados de IA com os sistemas da AMD.

Os pesos MXFP4 convertidos em GGML requerem aproximadamente 61 GB de VRAM, integrando-se perfeitamente aos 96 GB de memória gráfica dedicada do processador AMD Ryzen AI MAX+ 395. Os usuários precisam garantir que a versão do driver seja AMD Software: Adrenalin Edition 25.8.1 WHQL ou superior para utilizar este recurso com eficiência.

Com capacidades que atingem velocidades de 30 tokens por segundo, os usuários da AMD podem acessar um modelo potente com nível de data center. Esse desempenho é ainda mais aprimorado pela largura de banda da plataforma Ryzen AI MAX+, em conjunto com a inovadora arquitetura de combinação de especialistas presente no GPT-OSS 120B. Graças à sua ampla memória, os usuários também podem se beneficiar das implementações do Protocolo de Contexto do Modelo (MCP) com este modelo. Notavelmente, aqueles com processadores AMD Ryzen AI série 300 podem aproveitar ao máximo o modelo 20B menor.

Para um desempenho ideal com o modelo GPT-OSS 20B, os usuários são incentivados a utilizar a placa de vídeo AMD Radeon 9070 XT de 16 GB. Essa configuração não só oferece velocidades excepcionais, como também demonstra vantagens impressionantes de tempo até o primeiro token (TTFT), especialmente ao trabalhar com implementações do Protocolo de Contexto do Modelo (MCP) em cenários com uso intensivo de computação.

Como experimentar os modelos GPT-OSS 120B e 20B da OpenAI em hardware AMD

  1. Baixe e instale os drivers mais recentes do AMD Software: Adrenalin Edition 25.8.1 WHQL ou superior. Esteja ciente de que drivers mais antigos podem comprometer o desempenho e a compatibilidade.
  2. Para usuários com uma máquina com AMD Ryzen AI habilitado, navegue até a Área de Trabalho e selecione AMD Software: Adrenalin Edition > Guia Desempenho > Guia Ajuste > Memória Gráfica Variável.Defina o VGM de acordo com as especificações descritas na tabela anexa. Se estiver usando uma placa de vídeo AMD Radeon, você pode pular esta etapa.
  3. Instale o LM Studio no seu sistema.
  4. Quando solicitado, escolha pular o processo de integração.
  5. Procure por “gpt-oss” no aplicativo. Você deverá encontrar uma opção prefixada por “LM Studio community”.Selecione a variante 20B ou 120B de acordo com a compatibilidade do seu hardware.
  6. Acesse a aba de bate-papo no LM Studio.
  7. Use o menu suspenso para selecionar o modelo OpenAI desejado, certificando-se de marcar “Carregar parâmetros manualmente”.
  8. Ajuste o controle deslizante “GPU Offload” para a configuração máxima e ative a opção de lembrar configurações.
  9. Clique no botão de carregamento. Observe que o carregamento do modelo 120B pode levar algum tempo, e a barra de carregamento pode parecer travada devido ao tamanho do modelo.
  10. Comece a interagir com o modelo por meio de instruções!
Matriz de suporte a produtos AMD detalhando a compatibilidade com modelos OpenAI.

A AMD também divulgou uma lista de suporte para os modelos GPT-OSS da OpenAI. Seu Ryzen AI MAX+ 395 se destaca como o único chip capaz de rodar o modelo 120B. Em contraste, outras opções, como as GPUs Radeon RX 9000, Radeon AI PRO R9000 e Radeon RX 7000, todas equipadas com pelo menos 16 GB de memória, podem rodar os modelos GPT-OSS 20B com facilidade.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *