
Principais inovações apresentadas no Google I/O 2025
Durante o aguardado evento Google I/O 2025, o Google apresentou uma série de ferramentas inovadoras de inteligência artificial, destacando o lançamento do Gemini Flash 2.5, agora acessível a todos os usuários. Além disso, eles apresentaram o Gemma 3n, um modelo de linguagem pequena (LLM) projetado especificamente para operação em dispositivos locais.
Tecnologia revolucionária por trás do Gemma 3n
O recurso de destaque do Gemma 3n é a implementação de Embeddings por Camada (PLE), um desenvolvimento inovador do Google DeepMind. Essa tecnologia não apenas reduz o uso de memória, mas também melhora significativamente o desempenho. Com uma contagem bruta de parâmetros de 5 bilhões e 8 bilhões, o Gemma 3n atinge sobrecargas de memória semelhantes a modelos com apenas 2 bilhões e 4 bilhões de parâmetros. De acordo com o Google, ambas as configurações requerem apenas 2 GB e 3 GB de memória, respectivamente.
Recursos aprimorados de velocidade e qualidade
Além de seu compacto espaço de memória, o Gemma 3n emprega metodologias avançadas, incluindo compartilhamento de KVC e quantização de ativação, resultando em um aumento de desempenho de 1, 5 vez na velocidade de resposta em dispositivos móveis em comparação com seu antecessor, o Gemma 3 4B. Além disso, sua capacidade exclusiva de combinação permite a construção de submodelos dinâmicos que adaptam as respostas às necessidades específicas do usuário.
Execução local para privacidade e funcionalidade aprimoradas
Uma vantagem significativa do Gemma 3n é sua capacidade de operar por meio de execução local, garantindo que todo o processamento ocorra no dispositivo do usuário. Esse recurso garante que os dados não sejam transmitidos aos servidores, aumentando a privacidade e permitindo a operação sem conexão à internet — um recurso inestimável para usuários que exigem confiabilidade em cenários offline.
Capacidade multimodal e proficiência linguística
O Gemma 3n foi projetado para se destacar com entradas multimodais, processando áudio, texto e imagens com habilidade. Seus recursos aprimorados de compreensão de vídeo permitem lidar com tarefas complexas, como transcrições e traduções em diversas modalidades, oferecendo aos usuários uma experiência fluida na interação com diversos tipos de conteúdo.
Além disso, o modelo demonstrou uma melhora significativa no manuseio de idiomas diferentes do inglês, exibindo desempenho aprimorado em japonês, alemão, coreano, espanhol e francês. As métricas de desempenho indicam um desempenho sólido em benchmarks multilíngues, alcançando impressionantes 50, 1% no WMT24++.
Introdução ao Gemma 3n
Você pode começar a utilizar o Gemma 3n diretamente do seu navegador no Google AI Studio, sem necessidade de instalação. Para desenvolvedores interessados em integração local, o Google fornece recursos por meio do Google AI Edge. Esta plataforma oferece ferramentas e bibliotecas essenciais que oferecem recursos de processamento de texto e imagem aos usuários agora, com mais melhorias previstas para o futuro.
Deixe um comentário