
Copilot Vision lleva un tiempo disponible, pero su reciente integración en la app Copilot de Windows 11 supone un avance significativo. Tras probarla hace unos meses, cuando estaba limitada al navegador, me pareció decepcionante. Sin embargo, su versión de escritorio, ahora disponible para usuarios fuera de Estados Unidos (excluidas las regiones de la UE), presenta mejoras considerables.
Al principio, mi experiencia con Vision en el navegador Edge era limitada: solo podía interactuar con la pestaña abierta. Esto significaba que su funcionalidad era limitada. La mejora notable de la aplicación de escritorio de Windows es su capacidad para interactuar más allá de una sola pestaña del navegador, permitiendo a los usuarios seleccionar cualquier ventana abierta. Esta mejora amplía enormemente su usabilidad en diversas aplicaciones, ya sea para acceder a las indicaciones de comandos, las estadísticas de las aplicaciones o las ventanas de juegos, aunque no la probé en un contexto de juegos.

Al iniciar la aplicación de escritorio y seleccionar la función Vision, me encontré con un menú que podía elegir desde cualquier ventana abierta. Para mi primera prueba, abrí un artículo sobre la creación de un servidor multimedia. Si bien la interacción fue similar a mi experiencia anterior, la IA proporcionó una conversación fluida. Sin embargo, no fue del todo eficaz cuando pregunté por el sistema operativo del autor del artículo; se mencionaba demasiado abajo en la página como para que Vision pudiera recuperar esa información.
Sigue habiendo una limitación: Vision solo puede acceder al contenido visible dentro de la ventana seleccionada. Esto significa que no puede desplazarse ni acceder a información adicional en una página web ni interactuar directamente con los botones. Sin embargo, puede guiar a los usuarios resaltando los botones relevantes con una animación distintiva, pero la interacción final aún requiere clics manuales.

Explorando capacidades mejoradas
A diferencia de sus limitaciones anteriores, Copilot Vision ahora puede buscar información adicional en la web. Inicialmente, cuando solicité la designación del autor a la editorial, la respuesta fue negativa y me pidió permiso para buscar en línea. Tras obtener el permiso, proporcionó correctamente el título y más detalles de la página del autor, lo que demuestra una buena comprensión de la reformulación de la información.

Para evaluar mejor las capacidades de la IA, presenté una captura de pantalla del resultado de un script de comandos de shell de mi configuración de DietPi. En este caso, el asistente explicó correctamente el propósito de cada comando, reiterando los detalles sin necesidad de consultar la web.

A continuación, mostré solo los comandos y solicité aclaraciones. Vision describió con precisión la función de cada parámetro, lo que sugiere una sólida base de conocimientos interna, ya que no citaba fuentes en línea.

Para validar aún más su precisión, probé una lista de comandos de Docker que no había introducido previamente. Si bien Vision describió las acciones de los primeros cuatro comandos correctamente, fue necesario un mayor esfuerzo para obligarlo a continuar más allá de ese punto.

Al concluir mi evaluación, las respuestas fueron en general precisas, pero siguió siendo ambiguo si Vision aprovecha recursos en línea o utiliza únicamente su propio conjunto de datos.

Esta descripción general de Copilot Vision en Windows 11 destaca sus importantes avances. Si se siente cómodo navegando por las políticas de datos de Copilot, le recomiendo explorar sus funciones; está perfectamente integrado en la aplicación.
Deja una respuesta