Copilot se suma, como no podía ser de otra manera, a la ya gran «familia» de productos y servicios basados en inteligencia artificial que dejan cada vez más atrás las interacciones exclusivamente textuales, para alcanzar la omnimodalidad, es decir, la capacidad de ingerir entradas de texto, sí, pero también imágenes, audios, archivos, etcétera, con salidas igualmente multimodales. Y, claro, el principal campo de batalla (o, para ser más exactos, en el que Microsoft juega con mayor ventaja) no es otro que Windows 11.
Así, Microsoft ha comenzado a desplegar nuevas capacidades experimentales para Copilot en Windows, destinadas a los usuarios del programa Windows Insider. Se trata de dos avances significativos que amplían las habilidades del asistente más allá del texto: por un lado, funciones de visión para analizar contenido visual en pantalla; por otro, la posibilidad de buscar archivos locales mediante comandos de lenguaje natural. Un paso más en la evolución de Copilot como acompañante inteligente y contextualizado en el escritorio de Windows.
La primera gran novedad es la incorporación de capacidades de visión. Ahora, Copilot es capaz de interpretar el contenido visual de la pantalla, incluyendo imágenes, capturas, documentos en PDF y otros formatos gráficos. Esta función permitirá, por ejemplo, que el asistente describa una fotografía, extraiga texto de un cartel visualizado o ayude a leer documentos no editables, mejorando la accesibilidad. Para ello, el usuario deberá dar permiso explícito a Copilot para acceder a ventanas o aplicaciones específicas. Una salvaguarda necesaria si se considera que, en la práctica, estamos hablando de conceder a una inteligencia artificial la posibilidad de observar nuestro espacio de trabajo.
En paralelo, se ha anunciado una nueva función de búsqueda de archivos locales. Copilot podrá encontrar documentos, imágenes, presentaciones u otros archivos almacenados en el dispositivo a partir de instrucciones en lenguaje natural, eliminando la necesidad de recordar rutas o nombres de archivo exactos. La búsqueda se realiza de manera segura, respetando los permisos y configuraciones de privacidad del sistema, y el acceso a los archivos también requerirá la autorización previa del usuario.
Estas capacidades se complementan con nuevas opciones de interacción: Copilot podrá trabajar no solo sobre archivos cerrados, sino también sobre aplicaciones abiertas y ventanas activas, siempre con consentimiento explícito. Esto permitirá escenarios en los que el asistente pueda, por ejemplo, analizar el contenido de un documento abierto en Word o extraer información visual de una presentación en PowerPoint. Una funcionalidad potente, aunque inevitablemente acompañada de ciertas inquietudes respecto a la exposición de información sensible.
Todas estas funciones están disponibles de momento para miembros de Windows Insider en los canales Canary y Dev, como parte de una fase de pruebas previa a su posible despliegue general. Microsoft ha dejado claro que el proceso de autorización será explícito y que los usuarios tendrán control sobre qué comparten y qué no, una precaución imprescindible en un momento en el que la línea entre asistencia inteligente y privacidad personal se vuelve cada vez más fina. Una decisión más que comprensible, dada la mala experiencia de Windows Recall.
Copilot empieza a transitar el delicado equilibrio entre ser un asistente que ayuda de forma proactiva y el riesgo de convertirse en un observador demasiado intrusivo. Resulta fascinante pensar en el potencial de tener a nuestro lado una inteligencia capaz de ver, entender y actuar en nuestro entorno digital. Pero también me parece imprescindible no perder de vista la necesidad de establecer límites claros, de ejercer el control consciente sobre hasta dónde dejamos que la tecnología entre en nuestro espacio personal. Porque si algo nos enseña esta nueva etapa de Copilot es que, al final, toda gran ayuda conlleva también una gran responsabilidad.
Más información
La entrada Copilot empieza a sumar funciones de visión y búsqueda de archivos se publicó primero en MuyComputer.