
O Copilot Vision já está disponível há algum tempo, mas sua recente integração ao aplicativo Copilot do Windows 11 representa um avanço significativo. Tendo-o testado há alguns meses, quando estava restrito ao navegador, achei-o decepcionante. No entanto, sua versão para desktop, agora acessível a usuários fora dos Estados Unidos (exceto regiões da UE), revela melhorias consideráveis.
Inicialmente, minha experiência com o Vision no navegador Edge foi limitada — ele só conseguia interagir com a aba aberta no momento. Isso significava que sua funcionalidade era restrita. A melhoria notável no aplicativo para desktop do Windows é sua capacidade de interagir além de uma única aba do navegador, permitindo que os usuários selecionem qualquer janela aberta. Essa melhoria expande significativamente sua usabilidade em vários aplicativos, seja acessando prompts de comando, estatísticas de aplicativos ou janelas de jogos — embora eu não o tenha testado em um contexto de jogo.

Ao iniciar o aplicativo para desktop e selecionar o recurso Vision, encontrei um menu para escolher entre qualquer janela aberta. No meu primeiro teste, abri um artigo sobre a construção de um servidor de mídia. Embora a interação tenha sido semelhante à minha experiência anterior, a IA proporcionou uma conversa fluida. No entanto, a resposta foi negativa quando perguntei sobre o sistema operacional usado pelo autor do artigo — a informação estava muito abaixo na página para que o Vision pudesse recuperar essa informação.
Uma limitação permanece: o Vision só pode acessar o conteúdo visível dentro da janela selecionada. Isso significa que não é possível rolar ou acessar informações adicionais em uma página da web, nem interagir diretamente com botões. No entanto, ele pode guiar os usuários destacando botões relevantes com uma animação distinta, mas a interação final ainda requer clique manual.

Explorando Capacidades Aprimoradas
Diferentemente de suas limitações anteriores, o Copilot Vision agora permite pesquisar informações adicionais na web. Inicialmente, quando solicitei a designação do autor à editora, a resposta foi negativa e solicitei permissão para pesquisar online. Após obter a permissão, o Copilot Vision forneceu com sucesso o título e mais detalhes da página do autor, demonstrando um domínio razoável da reformulação de informações.

Para avaliar melhor as capacidades da IA, apresentei uma captura de tela do resultado de um script de comando shell da minha configuração DietPi. Nesse caso, o assistente descreveu corretamente o propósito de cada comando, reiterando detalhes sem precisar consultar a web.

Em seguida, exibi apenas os comandos e solicitei esclarecimentos. O Vision descreveu com precisão a função de cada parâmetro, sugerindo uma base de conhecimento interna robusta, já que não fez referência a fontes online.

Para validar ainda mais sua precisão, testei uma lista de comandos do Docker que eu não havia introduzido anteriormente. Embora o Vision tenha descrito as ações dos quatro primeiros comandos de forma eficaz, foi necessário um engajamento maior para forçá-lo a continuar além desse ponto.

Concluindo minha avaliação, as respostas foram geralmente precisas, mas permaneceu ambíguo se a Vision aproveita recursos online ou utiliza apenas seu próprio conjunto de dados.

Esta visão geral do Copilot Vision no Windows 11 destaca seus avanços significativos. Se você se sente confortável navegando pelas políticas de dados do Copilot, recomendo que explore seus recursos — ele é perfeitamente integrado ao aplicativo.
Deixe um comentário