Apple, 또 다른 돌파구를 마련하고 자연어 명령으로 이미지를 조작할 수 있는 새로운 AI 모델 공개

Apple은 여러 측면에서 ChatGPT나 Google의 Gemini에 비해 뒤떨어져 있습니다. 하지만 회사는 올해 말 iOS 18 출시와 함께 아이폰 16 라인업에 이 기술을 적용하는 것을 목표로 AI에 막대한 투자를 해왔습니다. 이제 애플 연구원들이 이미지 기반으로 이미지를 편집할 수 있는 새로운 AI 모델을 출시한 것으로 알려졌습니다. 사용자의 자연어 명령. 이 기술은 6월 회사의 WWDC 2024 행사에서 선보일 가능성이 높습니다.

Apple의 새로운 AI 모델은 자연어 입력을 해석하고 이미지를 조작할 수 있습니다.

” MGIE ” 또는 MLLM-Guided Image Editing 이라고 불리는 Apple의 새로운 AI 모델은 VentureBeat 를 통해 픽셀 수준에서 사용자 명령을 해석하고 실행할 수 있는 다중 모드 대형 언어 모델입니다 . 이 도구는 밝기, 선명도, 대비 등을 포함하여 이미지의 다양한 영역을 조작하고 편집할 수 있습니다. 또한 이미지를 조작하여 예술적 효과를 추가할 수도 있습니다.

이 외에도 로컬 편집으로 인해 사진 속 피사체의 모양, 색상, 크기 및 질감이 변경될 수 있습니다. Photoshop과 유사한 편집에는 이미지 크기 조정, 자르기, 회전 및 필터 추가가 포함됩니다. 사용자는 이미지의 배경을 변경할 수도 있습니다. Apple의 새로운 AI 모델은 상황과 일반적인 추론을 이해합니다. 예를 들어, 피자 이미지와 메시지를 추가하여 더 건강하게 만들 수 있습니다. AI 모델은 건강이 음식에 포함된 야채와 연관되어 있음을 이해하여 자동으로 이미지에 야채를 추가합니다.

도구는 전역 최적화 요청을 사용하여 이미지의 조명과 대비를 조작할 수 있습니다. 또한 Photoshop과 같은 편집 기능을 사용하면 사용자 요청에 따라 배경에서 개체를 제거할 수도 있습니다. 아래에 추가된 이미지에서 Apple의 AI 모델이 작동하는 모습을 볼 수 있습니다. 이 회사는 MGIE를 만들기 위해 캘리포니아 대학교 연구진과 제휴했으며, 기술이 준비되면 회사는 장치에 대한 다양한 애플리케이션을 만들 예정입니다. 이 논문은 2024년 ICLR(International Conference on Learning Representations)에서 발표되었습니다.

AI 모델을 확인하고 싶다면 사전 훈련된 모델이 포함된 코드와 데이터를 GitHub에서 확인할 수 있습니다. 애플은 꽤 오랫동안 AI 관련 작업을 진행해왔고, 구현이 늦어지더라도 업계와 기능이 다를 수 있다. 지난해 12월에는 플래시 메모리 활용 기술을 개발해 아이폰 등 애플 제품에서 대규모 언어 모델이 작동할 수 있게 했다.

Apple은 올해 말 iOS 18 및 기타 소프트웨어 업데이트와 함께 WWDC 2024 이벤트에서 일부 AI 기능을 발표할 예정입니다. 이전 보고서에서는 Apple이 올해 말 새로운 iPhone 모델 출시와 함께 생성 AI 기능을 배포할 것이라고 언급했습니다. iOS 18 은 현재 Google Assistant 및 Amazon Alexa에 비해 뒤떨어져 있기 때문에 AI를 사용하여 Siri를 스테로이드로 사용할 것입니다 .