A Apple está atrás de empresas como ChatGPT e Gemini do Google em vários aspectos. No entanto, a empresa investiu pesadamente em IA, pois pretende trazer a tecnologia para a linha do iPhone 16 ainda este ano com o lançamento do iOS 18. Agora está sendo relatado que os pesquisadores da Apple lançaram um novo modelo de IA que pode editar imagens com base comandos de linguagem natural pelo usuário. A tecnologia possivelmente será apresentada no evento WWDC 2024 da empresa, em junho.
O novo modelo de IA da Apple pode interpretar entradas de linguagem natural e manipular imagens
O novo modelo de IA da Apple, chamado “ MGIE ” ou edição de imagem guiada por MLLM , é um modelo multimodal de linguagem grande que pode interpretar e executar comandos do usuário em um nível de pixel (via VentureBeat ). A ferramenta pode manipular e editar uma infinidade de áreas de uma imagem, incluindo brilho, nitidez, contraste e muito mais. Também pode manipular uma imagem para adicionar efeitos artísticos.
Fora isso, a edição local pode alterar a forma, a cor, o tamanho e a textura do objeto em uma foto. A edição semelhante ao Photoshop inclui redimensionar a imagem ou cortar, girar e adicionar filtros. Os usuários também podem alterar o plano de fundo da imagem. O novo modelo de IA da Apple compreende o contexto e o raciocínio comum. Por exemplo, você pode adicionar a imagem de uma pizza e uma mensagem para torná-la mais saudável. O modelo de IA adicionará automaticamente vegetais à imagem, entendendo que a saúde está associada aos vegetais na alimentação.
Utilizando as solicitações de otimização global, a ferramenta pode manipular a iluminação e o contraste de uma imagem. Além disso, a edição semelhante ao Photoshop também pode eliminar objetos do fundo mediante solicitação do usuário. Você pode ver o modelo de IA da Apple em ação na imagem adicionada abaixo. A empresa fez parceria com pesquisadores da Universidade da Califórnia para criar o MGIE e, assim que a tecnologia estiver pronta, a empresa criará diversos aplicativos para seus dispositivos. O artigo foi apresentado na Conferência Internacional sobre Representações de Aprendizagem (ICLR) 2024.
Caso você tenha interesse em conferir o modelo de IA, o código e os dados com modelos pré-treinados estão disponíveis no GitHub. A Apple já trabalha em IA há algum tempo e, embora seja tarde para implementar, os recursos podem ser diferentes dos da indústria. No ano passado, em dezembro, a empresa inventou a técnica de utilização de memória flash em dezembro, permitindo que modelos de linguagem grande funcionassem no iPhone e em outros produtos da Apple.
A Apple anunciará alguns recursos de IA ainda este ano, potencialmente no evento WWDC 2024 junto com o iOS 18 e outras atualizações de software. Relatórios anteriores mencionaram que a Apple implantará recursos generativos de IA com o lançamento dos novos modelos de iPhone ainda este ano. O iOS 18 usará IA para colocar Siri em esteróides , já que atualmente fica atrás de nomes como Google Assistant e Alexa da Amazon.
Deixe um comentário