L'Autorité des Marchés et de la Concurrence du Royaume-Uni a émis une ordonnance contraignante pour que Google permette aux propriétaires de sites web, comme les journaux et les médias numériques, d'empêcher que leur contenu soit utilisé dans des fonctions de recherche avec intelligence artificielle, telles que AI Overviews. Cette décision vise à équilibrer le contrôle des éditeurs sur leurs données face à l'avancée des outils automatisés de Google.
Le mécanisme technique derrière l'exclusion des données ⚙️
Google devra mettre en œuvre un système technique permettant aux sites web d'utiliser des balises d'exclusion, similaires à celles déjà existantes pour le crawl des recherches traditionnelles. Ces balises, comme noindex ou robots.txt, pourront désormais être appliquées spécifiquement pour empêcher l'IA de Google d'extraire des fragments ou d'entraîner des modèles avec le contenu. Les éditeurs pourront configurer leurs serveurs pour bloquer l'accès des crawlers d'intelligence artificielle, ce qui implique des changements dans l'infrastructure d'indexation de Google et dans la manière dont ses algorithmes traitent les informations publiques.
L'IA demande désormais la permission, comme un enfant dans un magasin de bonbons 🍬
Il s'avère maintenant que l'intelligence artificielle, celle qui sait tout et peut tout faire, doit demander la permission pour utiliser les textes des journaux. C'est comme si un robot surdoué arrivait chez toi, buvait ton lait et utilisait ton wifi sans demander, et soudain tu lui dis : hé, demande la permission avant de piller le frigo. Google devra se mordre la langue algorithmique et accepter que tout ce qui brille sur Internet ne lui appartient pas.