Google Gemma 3n: 메모리 요구 사항 감소로 향상된 로컬 성능

Google I/O 2025에서 소개된 주요 혁신

많은 기대를 모았던 Google I/O 2025 행사에서 Google은 다양한 획기적인 인공지능 도구를 선보였으며, 모든 사용자가 이용할 수 있는 Gemini Flash 2.5 의 출시를 강조했습니다.또한, 로컬 기기 작동을 위해 특별히 설계된 소형 언어 모델(LLM)인 Gemma 3n도 소개했습니다.

Gemma 3n의 혁신적인 기술

Gemma 3n 의 가장 큰 특징은 Google DeepMind의 혁신적인 기술인 Per-Layer Embeddings(PLE) 구현입니다.이 기술은 메모리 사용량을 줄일 뿐만 아니라 성능을 크게 향상시킵니다. Gemma 3n은 50억 개와 80억 개의 원시 매개변수를 사용하므로, 매개변수가 20억 개와 40억 개에 불과한 모델과 유사한 메모리 오버헤드를 달성합니다. Google에 따르면 두 구성 모두 각각 2GB와 3GB의 메모리 만 사용합니다.

향상된 속도 및 품질 기능

Gemma 3n은 작은 메모리 공간 외에도 KVC 공유 및 활성화 양자화(Activation Quantization)를 포함한 고급 방법론을 사용하여 이전 버전인 Gemma 3 4B에 비해 모바일 기기에서 1.5배 빠른 응답 속도를 제공합니다.또한, 고유한 믹스 앤 매치 기능을 통해 특정 사용자 요구에 맞춰 응답을 조정하는 동적 하위 모델을 구축할 수 있습니다.

향상된 개인 정보 보호 및 기능을 위한 로컬 실행

Gemma 3n의 중요한 장점은 로컬 실행을 통해 모든 처리가 사용자 기기에서 이루어지도록 보장하는 기능입니다.이 기능은 데이터가 서버로 전송되지 않도록 보장하여 개인정보 보호 기능을 강화하고 인터넷 연결 없이도 작동할 수 있도록 합니다.오프라인 환경에서 안정성이 필요한 사용자에게는 매우 중요한 자산입니다.

다중 모드 능력 및 언어 능력

Gemma 3n은 다중 모드 입력에 탁월하도록 설계되어 오디오, 텍스트, 이미지를 능숙하게 처리합니다.향상된 비디오 이해 기능을 통해 다양한 모드에 걸친 필사 및 번역과 같은 복잡한 작업을 처리하여 사용자에게 다양한 콘텐츠 유형과의 원활한 상호작용 경험을 제공합니다.

또한, 이 모델은 영어가 아닌 언어 처리에서도 눈에 띄는 개선을 보였으며, 특히 일본어, 독일어, 한국어, 스페인어, 프랑스어 에서 향상된 성능을 보였습니다.성능 지표는 다국어 벤치마크에서 높은 성능을 보였으며, WMT24++에서 50.1% 라는 인상적인 성과를 달성했습니다.

Gemma 3n 시작하기

Google AI Studio 에서 브라우저에서 Gemma 3n을 바로 사용할 수 있으며, 설치는 필요하지 않습니다.로컬 통합에 관심 있는 개발자를 위해 Google은 Google AI Edge를 통해 리소스를 제공합니다.이 플랫폼은 현재 사용자에게 텍스트 및 이미지 처리 기능을 제공하는 필수 도구와 라이브러리를 제공하며, 향후 더욱 향상된 기능을 제공할 예정입니다.

출처 및 이미지

Google Gemma 3n: 메모리 요구 사항 감소로 향상된 로컬 성능

Google I/O 2025에서 소개된 주요 혁신

Gemma 3n의 혁신적인 기술

향상된 속도 및 품질 기능

향상된 개인 정보 보호 및 기능을 위한 로컬 실행

다중 모드 능력 및 언어 능력

Gemma 3n 시작하기

관련 기사:

데스티니 2의 딥 던전 유령에 대한 완벽한 가이드

Windows가 CPU 속도를 잘못 해석하는 방식: Microsoft 엔지니어의 통찰력

답글 남기기 응답 취소