Suite à des allégations concernant l’utilisation de fichiers privés par son modèle d’IA, Google a déclaré que Gemini est capable de lire et de résumer ce type de données sensibles en temps réel, mais uniquement avec l’autorisation explicite des utilisateurs de Workspace.
Un responsable de la communication de Google a assuré à The Register que « ni le résumé ni le document lui-même ne sont stockés » par Gemini pour un traitement ou un entraînement futur.
Ce débat a été déclenché lorsque Kevin Bankston, conseiller senior en gouvernance de l’IA au Center for Democracy & Technology, a tweeté qu’il avait ouvert sa déclaration de revenus dans Google Docs, et que Gemini, sans son consentement, l’avait immédiatement résumée.
« Donc… Gemini ingère automatiquement même les documents privés que j’ouvre dans Google Docs ? C’est quoi ce délire, les gars. Je n’ai pas demandé ça, » a déclaré Bankston. « Maintenant, je dois chercher de nouveaux paramètres dont je n’ai jamais été informé pour désactiver cette fonctionnalité. »
Comme l’a souligné Bankston, cela est particulièrement préoccupant compte tenu des antécédents de Google en matière de fuites de conversations privées via ses outils d’IA générative dans les résultats de recherche publics.
Dans un long message sur X, Bankston a détaillé ses difficultés et frustrations à trouver les bons paramètres pour désactiver cette soi-disant « fonctionnalité ». Il a même demandé à Gemini où trouver ses paramètres de confidentialité, mais cela n’a pas fonctionné non plus.
Par ailleurs, il semblait que l’IA avait accès à plus que ses seuls documents fiscaux. « En faisant un peu plus de tests, il semble que cela se produise avec n’importe quel PDF que j’ouvre depuis Drive, » a-t-il déclaré. « Heureusement, cela ne se produit pas (encore ?) automatiquement avec Google Docs. »
Il a fallu près d’une semaine, ainsi que des échanges avec des personnes réelles chez Google, avant que Bankston, qui enseigne le droit de l’IA à l’Université de Georgetown, ne parvienne à résoudre le problème – ce qui n’est pas de bon augure pour les utilisateurs ordinaires, qui n’ont probablement ni les connaissances techniques de Bankston ni la visibilité nécessaire pour attirer l’attention de Google lorsque les choses tournent mal.
Il y a un an, Bankston s’est inscrit pour participer aux Google Workspace Labs. Ce programme d’accès anticipé permet aux utilisateurs de tester certaines fonctionnalités d’IA générative et de donner leur avis. L’une de ces fonctionnalités de Gemini dans Workspace est un panneau latéral qui résume les documents.
En gros, ce qui s’est passé ici, selon Google et Bankston, c’est que Bankston utilisait déjà Gemini via le panneau latéral dans Google Drive pour les PDF. Une fois qu’un utilisateur active ce panneau latéral, il résume un document ouvert en temps réel. De plus, il résume automatiquement chaque PDF par la suite jusqu’à ce que l’utilisateur ferme le panneau latéral.
« Cela se produit parce qu’une fois que vous commencez à utiliser Gemini, nous avons des paramètres qui respectent les préférences des utilisateurs et qui se poursuivent dans les sessions ultérieures au sein de nos produits, » a déclaré un porte-parole de Google à The Register.
- Google finit par répondre à ces résultats de recherche IA étranges
- Google pense que l’IA peut mieux rechercher que vous
- Le GPT-4o Mini d’OpenAI est effectivement petit – comme son avance sur ses concurrents dans certains tests
- Si vous pensez que les laboratoires d’IA n’iraient pas jusqu’à utiliser des sous-titres YouTube pour l’entraînement, détrompez-vous
Le porte-parole a confirmé que la société avait eu de bonnes discussions avec Bankston au cours de la semaine précédente et a nié que son modèle d’IA ingère les données des utilisateurs de Workspace.
« Une grande méprise dans le fil original que nous avons examiné est l’idée que l’ingestion de données se produit. Ce n’est pas le cas, » a ajouté le porte-parole. « Lorsque la fonctionnalité est activée, le contenu d’un document ouvert peut être utilisé pour générer un résumé en temps réel, mais ni ce résumé ni le document lui-même ne sont stockés. »
Bankston a refusé de commenter au-delà de sa série de tweets, qui a commencé le 10 juillet et s’est terminée le 16 juillet. Dans certains de ses derniers tweets, il a également noté que Google ne conserve pas les données que Gemini résume, ce qui, selon lui, « est à la fois bon et mauvais du point de vue de la confidentialité. »
La confusion provient également du fait que le chatbot Gemini et les intégrations de Gemini sont deux choses distinctes. Comme l’a décrit Bankston : « Les extensions d’application Gemini ne contrôlent que si Gemini chat peut accéder aux données *d’autres* applications comme Workspace ou YouTube pour personnaliser votre expérience de chat. De manière déroutante, cela ne contrôle pas les fonctionnalités de Gemini *dans* ces applications. »
La bonne nouvelle, a-t-il expliqué, est que cela signifie que tous ces résumés créés par des utilisateurs qui n’ont jamais fermé le panneau latéral ne sont pas conservés dans des journaux.
Mais d’un autre côté, a ajouté Bankston, « cela rend également la confusion entre Gemini dans d’autres applications et l’application de chat Gemini encore plus grande, car elles traitent désormais les données de manière très différente. » ®