Google Gemma 3n: Desempenho local aprimorado com menor necessidade de memória

Google Gemma 3n: Desempenho local aprimorado com menor necessidade de memória

Principais inovações apresentadas no Google I/O 2025

Durante o aguardado evento Google I/O 2025, o Google apresentou uma série de ferramentas inovadoras de inteligência artificial, destacando o lançamento do Gemini Flash 2.5, agora acessível a todos os usuários. Além disso, eles apresentaram o Gemma 3n, um modelo de linguagem pequena (LLM) projetado especificamente para operação em dispositivos locais.

Tecnologia revolucionária por trás do Gemma 3n

O recurso de destaque do Gemma 3n é a implementação de Embeddings por Camada (PLE), um desenvolvimento inovador do Google DeepMind. Essa tecnologia não apenas reduz o uso de memória, mas também melhora significativamente o desempenho. Com uma contagem bruta de parâmetros de 5 bilhões e 8 bilhões, o Gemma 3n atinge sobrecargas de memória semelhantes a modelos com apenas 2 bilhões e 4 bilhões de parâmetros. De acordo com o Google, ambas as configurações requerem apenas 2 GB e 3 GB de memória, respectivamente.

Recursos aprimorados de velocidade e qualidade

Além de seu compacto espaço de memória, o Gemma 3n emprega metodologias avançadas, incluindo compartilhamento de KVC e quantização de ativação, resultando em um aumento de desempenho de 1, 5 vez na velocidade de resposta em dispositivos móveis em comparação com seu antecessor, o Gemma 3 4B. Além disso, sua capacidade exclusiva de combinação permite a construção de submodelos dinâmicos que adaptam as respostas às necessidades específicas do usuário.

Execução local para privacidade e funcionalidade aprimoradas

Uma vantagem significativa do Gemma 3n é sua capacidade de operar por meio de execução local, garantindo que todo o processamento ocorra no dispositivo do usuário. Esse recurso garante que os dados não sejam transmitidos aos servidores, aumentando a privacidade e permitindo a operação sem conexão à internet — um recurso inestimável para usuários que exigem confiabilidade em cenários offline.

Capacidade multimodal e proficiência linguística

O Gemma 3n foi projetado para se destacar com entradas multimodais, processando áudio, texto e imagens com habilidade. Seus recursos aprimorados de compreensão de vídeo permitem lidar com tarefas complexas, como transcrições e traduções em diversas modalidades, oferecendo aos usuários uma experiência fluida na interação com diversos tipos de conteúdo.

Além disso, o modelo demonstrou uma melhora significativa no manuseio de idiomas diferentes do inglês, exibindo desempenho aprimorado em japonês, alemão, coreano, espanhol e francês. As métricas de desempenho indicam um desempenho sólido em benchmarks multilíngues, alcançando impressionantes 50, 1% no WMT24++.

Introdução ao Gemma 3n

Você pode começar a utilizar o Gemma 3n diretamente do seu navegador no Google AI Studio, sem necessidade de instalação. Para desenvolvedores interessados ​​em integração local, o Google fornece recursos por meio do Google AI Edge. Esta plataforma oferece ferramentas e bibliotecas essenciais que oferecem recursos de processamento de texto e imagem aos usuários agora, com mais melhorias previstas para o futuro.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *