El entrenamiento de las IA es otro de los puntos polémicos de la revolución tecnológica del momento. Los grandes modelos de inteligencia artificial son insaciables y consumen recursos de manera voraz. Si el consumo de energía para alimentar miles y miles de aceleradoras es hoy un gran problema y amenaza la sostenibilidad global, no lo es menos el consumo de datos.
¿Cómo, de dónde y en qué condiciones las grandes tecnológicas obtienen los datos para el entrenamiento de las IA? La respuesta es imposible porque la carrera de aprendizaje desenfrenada de los grandes modelos conlleva ‘chupar’ datos de cualquier sitio, incluyendo vulneraciones masivas de derechos de autor. Otro punto de la ecuación es el de la privacidad, un aspecto que siempre ha sido polémico en la era digital, pero que se ha acuciado desde la llegada de funciones de inteligencia artificial.
El entrenamiento de las IA y Gmail
Google ha tenido que salir a responder publicaciones virales que circulan en las redes sociales y algunos medios dedicados a la ciberseguridad, que acusan al gigante de Internet de entrenar a su asistente Gemini con los correos electrónicos de los usuarios. Sin su conocimiento y permiso.
Informes en redes aseguraban que todos los usuarios de Gmail habían sido «autorizados automáticamente a permitir que Gmail acceda a todos sus mensajes privados y archivos adjuntos para entrenar modelos de IA», y aconsejaban la desactivación manual de las ‘Funciones Inteligentes’, las herramientas de productividad impulsadas por IA del servidor de correo electrónico.
En un comunicado, la portavoz de Google, Jenny Thomson, explicó que «esos informes son engañosos: no hemos cambiado la configuración de nadie, las funciones inteligentes de Gmail existen desde hace muchos años y no usamos su contenido de Gmail para entrenar nuestro modelo de inteligencia artificial Gemini».
Conviene aclarar que la política de privacidad de Google Workspace establece que cualquier dato compartido directamente con Gemini (por ejemplo, una solicitud que escribas en la aplicación) se conservará y podrá usarse para el entrenamiento de IA. Sin embargo, los datos de las aplicaciones de Google Workspace, como Documentos de Google, Hojas de Cálculo o Gmail, no se utilizan para el entrenamiento de IA ni Gemini accede a ellos automáticamente. Gemini puede acceder a los datos de Google Workspace si se lo indicas, por ejemplo, al pedirle a la IA que revise tu copia en Documentos de Google.
Google actualizó su configuración de personalización de funciones inteligentes para que el cliente pueda desactivar las funciones de Google Workspace y de otros productos de Google (como Maps y Wallet) de manera independiente.
Aunque las afirmaciones sobre la recopilación de datos de los usuarios por parte de Gmail no se hayan probado, es comprensible la preocupación de los usuarios. Y no solo por Google. Meta, Amazon, Microsoft… tienen centenares de millones de usuarios que acceden diariamente a sus servicios y aportan datos de todo tipo. Teniendo en cuenta los antecedentes anteriores de recopilación ilegal de datos y la ‘selva’ sin control ni trasparencia en la que se ha convertido el entrenamiento de las IA es lógica la enorme desconfianza de los usuarios.
La entrada El entrenamiento de las IA: Google niega que use cuentas de Gmail se publicó primero en MuyComputer.


