
El año pasado, Microsoft anunció el desarrollo de Copilot Vision, diseñado para revolucionar la forma en que los usuarios interactúan con las páginas web en Microsoft Edge. Inicialmente lanzado para usuarios de la suscripción Pro en Estados Unidos, este innovador asistente de IA ya está disponible para los usuarios gratuitos, aunque con restricciones geográficas aún vigentes.
Tras su lanzamiento, Windows Latest tomó la iniciativa de explorar las capacidades de Copilot Vision mediante una máquina virtual estadounidense. El proceso comenzó con una búsqueda en Bing de «Copilot Vision», seleccionando un enlace relevante y haciendo clic en «Pruébalo ahora».Al aceptar los términos y condiciones, se preparó el terreno para esta experiencia innovadora.

Si bien Microsoft proporcionó una breve descripción general de cómo funciona Copilot Vision, muchos usuarios encontraron que las instrucciones iniciales carecían de claridad.
Introducción a Copilot Vision en Microsoft Edge en Windows 11
Al iniciar Copilot Vision en la barra lateral de Edge, comencé explorando la página oficial de Vision haciendo clic aquí. Emocionado por comprender sus funcionalidades, le pregunté a Copilot Vision sobre el contenido de la página web. Desafortunadamente, la IA se quedó en blanco rápidamente durante nuestra conversación.
Pensando que era un fallo temporal, repetí mi pregunta. Lamentablemente, tras una breve interacción, la IA se detuvo a mitad de la respuesta, intentando encontrar una respuesta, pero sin lograr mantener un diálogo coherente. Era evidente que Copilot tenía dificultades para comprender el contexto y mantener una conversación fluida.
Continuando en el sitio web de Microsoft, pregunté cuántos botones aparecían en la página. Copilot Vision respondió correctamente que había un botón destacado llamado «Pruébalo».Sin embargo, no reconoció un segundo botón vital para reproducir un video.

Al intentar interactuar con Copilot Vision, solicitándole que hiciera clic en el botón o reprodujera el video, recibí rechazos. La IA no pudo interactuar con los elementos de la página ni siquiera pausar su respuesta.
Evaluación de la utilidad de la visión del copiloto
Tras cerrar la ventana innecesaria, visité la página principal de Windows Latest y volví a visitar Copilot Vision. Para mi alivio, describía con precisión un nuevo artículo. Este momento despertó optimismo sobre el potencial de Vision, aunque su fiabilidad seguía planteando importantes preocupaciones.
A continuación, probé Copilot en Amazon UK, solicitando información sobre los mejores SSD según los resultados de búsqueda. La IA ofreció información sobre muchos SSD, pero falló al comparar las ofertas de Acer y WD. Aunque Copilot ofreció un análisis superficial, no fue suficiente debido a su falta de funcionalidades para realizar consultas web externas.
Cuando pregunté sobre las especificaciones de rendimiento de un SSD de Acer, Copilot no pudo proporcionar información específica, ya que estaba fuera de su comprensión y capacidades actuales. Intenté acceder a datos adicionales a través de Bing, ya que rechazó mi solicitud de búsqueda.

Si bien Copilot puede ayudar con la extracción rápida de datos de áreas visibles, su falta de profundidad lo convierte en un aliado poco fiable para investigaciones serias. Al ser alertada sobre productos patrocinados, la IA solo identificó a Sandisk, omitiendo a competidores como Samsung a pesar de estar presentes en la página.

Este descuido refuerza el hecho de que Copilot Vision solo puede interpretar los elementos visibles de la pantalla y no puede navegar por páginas completas, lo que limita su funcionalidad. Incluso al desplazarse por el sitio para encontrar elementos adicionales, perdía la continuidad y no recordaba las menciones anteriores.

En definitiva, el rendimiento actual de Copilot Vision deja mucho que desear. Su tendencia a buscar excesivamente la aprobación del usuario, disculpándose a menudo por las deficiencias, demuestra la necesidad de mejoras adicionales. Es necesario integrar funciones importantes como la mejora del desplazamiento o la posibilidad de acceder al contenido completo de una página web para mejorar la experiencia del usuario.
Preguntas frecuentes
1.¿Qué es Copilot Vision y cómo funciona en Microsoft Edge?
Copilot Vision es un asistente de IA integrado en Microsoft Edge que permite a los usuarios interactuar con páginas web mediante comandos de voz. Al activar esta función, los usuarios pueden hacer preguntas y recibir respuestas habladas sobre el contenido que se muestra en pantalla.
2.¿Por qué Copilot Vision tiene problemas con las interacciones de las páginas web?
Las limitaciones actuales de Copilot Vision incluyen su incapacidad para interactuar con elementos de la página o buscar información externa en línea, lo que reduce su eficacia para proporcionar respuestas completas. Solo puede analizar el texto visible, pero no logra entablar una conversación profunda y significativa sobre el contenido.
3.¿Copilot Vision está disponible para todos los usuarios de Microsoft Edge?
Inicialmente disponible solo para usuarios de la suscripción Pro en Estados Unidos, Copilot Vision se ha extendido también a los usuarios gratuitos. Sin embargo, por el momento, esta implementación también está limitada a los usuarios de Estados Unidos.
Deja una respuesta ▼