GPUs NVIDIA RTX oferecem desempenho de IA incomparável para os novos modelos “gpt-oss” da OpenAI

GPUs NVIDIA RTX oferecem desempenho de IA incomparável para os novos modelos “gpt-oss” da OpenAI

A NVIDIA, em colaboração com a OpenAI, revelou a mais recente adição ao seu conjunto de modelos de IA: a família gpt-oss. Este lançamento oferece aos consumidores acesso a uma tecnologia de IA inovadora, aproveitando os recursos excepcionais de processamento das GPUs RTX.

A NVIDIA detalhou hoje sua parceria com a OpenAI, marcando um avanço significativo que permite que inteligência artificial de ponta opere rapidamente em PCs e estações de trabalho com tecnologia RTX — recursos que antes eram limitados a data centers em nuvem.

O fundador e CEO da NVIDIA, Jensen Huang, destacou a importância dessa mudança para a indústria de tecnologia:

“A OpenAI mostrou ao mundo o que poderia ser construído com a IA da NVIDIA — e agora eles estão promovendo a inovação em software de código aberto”, disse Jensen Huang.“Os modelos gpt-oss permitem que desenvolvedores em todos os lugares construam sobre essa base de código aberto de última geração, fortalecendo a liderança tecnológica dos EUA em IA — tudo isso na maior infraestrutura de computação de IA do mundo.”

Este lançamento representa um momento crucial, inaugurando uma era de IA mais rápida e inteligente nos dispositivos, impulsionada pelos recursos formidáveis das GPUs GeForce RTX e PRO. Duas versões do modelo estão sendo lançadas, atendendo a um amplo espectro de usuários:

  • Modelo gpt-oss-20b: Adaptado para desempenho ideal em PCs NVIDIA RTX AI equipados com no mínimo 16 GB de VRAM, este modelo pode processar até 250 tokens por segundo quando executado em uma GPU RTX 5090.
  • Modelo gpt-oss-120b: Projetado para ambientes profissionais, este modelo é compatível com GPUs NVIDIA RTX PRO, maximizando os recursos de processamento.
OpenAI arrecada US$ 8, 3 bilhões em fundos
OpenAI garante US$ 8, 3 bilhões como parte de um esforço de financiamento de US$ 40 bilhões

Os modelos gpt-oss são os primeiros a utilizar a precisão do MXFP4 na NVIDIA RTX, um método de treinamento de ponta que aprimora a qualidade do modelo sem comprometer o desempenho em relação às técnicas mais antigas. Ambos os modelos apresentam uma impressionante capacidade de comprimento de contexto de até 131.072 tokens, uma das mais abrangentes disponíveis para inferência local. Eles apresentam uma arquitetura flexível de mistura de especialistas (MoE), permitindo recursos de cadeia de pensamento e apoiando o acompanhamento de instruções e o uso de ferramentas.

O RTX AI Garage desta semana está focado em como desenvolvedores e entusiastas de IA podem utilizar efetivamente os novos modelos OpenAI em GPUs NVIDIA RTX:

    Fonte e Imagens

    Deixe um comentário

    O seu endereço de email não será publicado. Campos obrigatórios marcados com *