2024년은 특히 Gemini 배너 아래에서 다양한 AI 혁신을 공개한 Google의 기술 환경을 크게 재편했습니다. 이 이니셔티브는 여러 기본 AI 모델과 함께 대화형 챗봇을 두드러지게 특징으로 합니다.
Google은 올해 내내 생성 AI 도메인에서 수많은 제품과 개선 사항을 도입했습니다. 이러한 새로운 Gemini 기능의 하이라이트 외에도 기술 거대 기업이 2024년에 단종한 다양한 제품과 예상되는 Instagram 기능 위시리스트를 살펴볼 가치가 있습니다.
참고: 다음 목록은 주로 2024년에 출시되는 제미니의 주요 특징을 강조하지만, 모든 개발 사항을 포함하는 것은 아닙니다.
바드에서 제미니까지: 리브랜딩 혁명
올해의 주요 전환은 Google이 Bard 챗봇을 Gemini로 리브랜딩하고 명명 규칙을 기존 모델과 일치시키는 것이었습니다. 이 전환과 함께 기술 회사는 Gemini 1.0 Pro 모델을 출시하고 230개국에서 40개 이상의 언어로 챗봇을 사용할 수 있게 했습니다.
Google 엔지니어는 Gemini라는 이름의 상징성을 설명하면서, 이를 이중성으로 알려진 조디악 사인과 연관시켰는데, 이는 Gemini가 다양한 데이터 유형을 처리하는 능력과 일맥상통합니다. 또한, 이 이름은 NASA의 초기 달 탐사 계획인 Project Gemini에 경의를 표합니다.
모바일 앱과 구독 모델 출시
2월에 Google은 Android용 Gemini 앱을 출시하여 궁극적으로 기본 음성 비서인 Google Assistant를 대체했습니다. Android 사용자는 새로운 챗봇을 받아들였지만 iOS 사용자는 Google 앱을 통해 액세스할 수 있었습니다.
같은 달에 제미니 어드밴스드(Gemini Advanced)라는 유료 구독 서비스가 출시되어 사용자는 제미니 울트라 1.0, 1.5 프로와 제미니-익스-1206과 같은 실험적 버전을 포함한 가장 고급형 모델을 사용할 수 있게 되었습니다.
게다가 Chromebook Plus 기기에서는 “글쓰기 도움말”과 같은 기능을 사용할 수 있게 되어 홈 화면 앱 선반에 편리한 Gemini 버튼이 추가되었습니다.
Google Maps에 AI 통합
3월에 Google은 Google Maps에 대한 지원을 통합하여 Gemini 챗봇의 유용성을 높였습니다. 이제 사용자는 챗봇을 통해 직접 내비게이션 명령을 내릴 수 있습니다.
예를 들어, 사용자가 “[X]로 길 안내해 주세요”라고 말하면 Gemini가 이동 거리, 예상 소요 시간, Google 지도 링크와 같은 정보를 제공하고, 그 후 바로 길 안내를 시작합니다.
Vids 소개: 새로운 비디오 제작 도구
4월에 Google은 Gemini 강화 도구인 Vids를 출시했는데, 이는 교육, 마케팅 및 기타 목적을 위한 비디오 제작을 간소화하는 것을 목표로 합니다. 타임라인 스타일 인터페이스를 통해 사용자는 Google Drive에서 비디오 자산을 원활하게 조립하고, 음성 해설을 녹음하거나, 애플리케이션에서 직접 촬영할 수 있습니다.
협업 기능을 사용하면 사용자가 프로젝트를 편집, 댓글 달기 또는 볼 수 있는 사람을 관리할 수 있습니다. Google Vids는 Workspace 제품군 내의 유료 애드온입니다.
YouTube 음악 통합
5월에는 새로운 YouTube Music 확장 프로그램이 출시되어 Gemini 사용자가 YouTube Music에 접속해 트랙을 검색하고, 라디오 방송을 청취하고, 새로운 아티스트와 재생목록을 살펴볼 수 있게 되었습니다.
지속적인 개발: 새로운 Gemini 모델
2024년에는 Gemini 모델에 대한 다양한 업그레이드도 있었습니다. 5월에 출시된 Gemini 1.5 Flash는 요약, 채팅 상호작용, 이미지 및 비디오 캡션, 데이터 추출과 같은 작업에 최적화된 가벼운 LLM을 제공했습니다.
추가적인 개선 사항에는 Gemini 1.5 Flash-8B라는 더 컴팩트한 버전과 코딩 작업의 성능이 향상된 새로운 Gemini 1.5 Pro 모델이 포함되었습니다. 12월에 Google은 기본적으로 생성된 이미지와 다국어 오디오 기능을 지원하는 실험적 Gemini 2.0 Flash 모델을 공개했습니다.
사진 도우미에게 물어보세요
Google I/O 2024에서 Ask Photos 어시스턴트가 공개되었습니다. Gemini가 구동하는 이 디지털 도우미는 갤러리를 살펴보고, 개인화된 캡션을 생성하고, 여행에서 스냅샷을 만들도록 설계되었습니다.
교육 분야로 확장
5월에 Google은 Gemini Education과 Gemini Education Premium이라는 두 가지 새로운 애드온을 출시하여 Gemini 기능을 교육 분야로 확장했습니다. 이러한 기능에는 AI 기반 노트 작성 기능과 향상된 데이터 보호 조치가 포함됩니다.
Workspace 애플리케이션에 Gemini 임베딩
플랫폼 전반에 AI를 통합하려는 사명을 이어가면서 Google은 6월에 Workspace 애플리케이션 내에서 Gemini 사이드 패널을 공개했습니다. 이 패널은 앱의 컨텍스트에 따라 기능을 사용자 정의합니다. 예를 들어, Gemini는 Gmail의 이메일 스레드를 요약하거나 Google Slides에서 프레젠테이션 슬라이드를 만드는 데 도움을 줄 수 있습니다.
11월에는 Gemini 사이드 패널이 Google Chat에 추가되어 사용자가 대화를 효율적으로 요약할 수 있게 되었습니다.
Gemini Live 소개
8월 Pixel 하드웨어 이벤트에서 Google은 Gemini Live를 출시하여 AI 챗봇과 역동적인 대화 경험을 만들었습니다. 사용자는 앱이 백그라운드에서 실행 중이거나 기기가 잠겨 있는 동안에도 자연스러운 대화에 참여하고 대화를 재개할 수 있습니다.
이 기능은 원래 Gemini Advanced 플랜에 포함되었으나, 나중에 Android와 iOS용 Gemini 앱을 통해 모든 사용자가 이용할 수 있게 되었고, 그 후 곧 40개 이상의 언어가 지원되기 시작했습니다.
맞춤형 보석 만들기
Custom Gems가 출시되면서 사용자는 이제 이벤트에 대한 아이디어를 브레인스토밍하거나 가상 튜터 역할을 하는 등 특정 작업에 맞게 자신만의 Gemini 챗봇을 맞춤 설정할 수 있습니다.
이 프리미엄 기능은 150개국 이상의 Gemini Advanced, Business 및 Enterprise 플랜 사용자가 이용할 수 있습니다. 사용자는 미리 만들어진 보석을 탐색하거나 Gem 관리자를 통해 직접 새 보석을 만들 수 있습니다.
Imagen 3 및 Whisk Generator 출시
10월에 Google은 Gemini 생태계와 완벽하게 통합되어 모든 언어를 지원하는 최상위 텍스트-이미지 생성 모델인 Imagen 3을 출시했습니다. 이 모델은 사용자 지침에 대한 이해를 높여 사실적인 풍경, 예술적 그림, 상상력이 풍부한 장면을 만들 수 있으며, 이후의 개선이 가능합니다.
Google은 Imagen 3 외에도 기존 이미지에서 이미지를 생성할 수 있는 Whisk 도구를 공개하여 창의적인 서비스를 더욱 확대했습니다.
Gemini, Opera 및 Snapchat과 협업
Google은 Opera와 협력하여 Gemini의 기능을 Aria 브라우저 내 AI에 통합하여 고급 텍스트-음성 및 이미지 생성 기능으로 탐색 경험을 개선했습니다.
또한 Snapchat은 Google과 협력하여 My AI 챗봇을 개선하여 더욱 정교한 멀티모달 경험을 제공했습니다. 보고서에 따르면 이 통합으로 미국에서 플랫폼의 사용자 참여도가 2.5배 증가했습니다.
심층 연구: 새로운 AI 연구 보조원
광범위한 연구에 참여하는 사람들을 위해 새로운 Deep Research Assistant는 프로세스를 간소화하는 것을 목표로 합니다. 이 도구는 철저한 문서 분석, 요약 및 대규모 데이터 세트에서 중요한 통찰력 추출을 용이하게 합니다.
Gemini Advanced에서 Deep Research라는 새로운 에이전트 기능도 선보입니다. 이는 복잡한 주제를 파고들어 관련 소스에 대한 링크가 포함된 보고서를 생성할 수 있는 연구 지원 기능입니다. pic.twitter.com/imYd4tktEG
— 순다르 피차이(@sundarpichai) 2024년 12월 11일
Deep Research는 Gemini Advanced의 일부로 제공되며 150개국 이상에서 45개 이상의 언어를 지원합니다.
지도에서 자연어로 탐색하기
최근 Google Maps의 향상된 기능으로 이제 사용자가 자연어 검색을 수행할 수 있습니다. 예를 들어, “밤에 친구들과 할 일”을 입력하면 제안된 위치에 대한 요약된 리뷰가 표시되어 보다 직관적인 검색 환경을 제공합니다.
Spotify에서 스트리밍
Gemini의 최신 업데이트로 YouTube Music과 함께 Spotify와의 호환성이 도입되었습니다. 사용자는 이제 Android에서 Gemini 인터페이스를 통해 노래를 요청하고, 플레이리스트를 탐색하고, 가사를 사용하여 음악을 검색할 수 있습니다. Spotify Premium 계정이 있는 경우입니다.
쌍둥이자리를 둘러싼 논란
발전에도 불구하고 Google의 Gemini는 논란에 직면했습니다. 2월에 이미지 생성 기능이 편향적이라는 비판을 받아 Google이 우려 사항을 해결하는 동안 서비스가 일시적으로 중단되었습니다.
다른 보고서에서는 특정 설정이 비활성화된 경우에도 허가되지 않은 PDF 요약 사건이 언급되었습니다. 또한, 조사 결과 계약자 팀이 경쟁 모델과 비교하여 Gemini의 출력을 평가하는 데 도움을 주었으며, 응답 유사성에 대한 의문이 제기되었습니다.
답글 남기기