La Autoridad de Mercados y Competencia del Reino Unido ha emitido una orden vinculante para que Google permita a los propietarios de sitios web, como periódicos y medios digitales, impedir que su contenido sea utilizado en funciones de búsqueda con inteligencia artificial, como AI Overviews. Esta decisión busca equilibrar el control de los editores sobre sus datos frente al avance de las herramientas automatizadas de Google.
El mecanismo técnico detrás de la exclusión de datos ⚙️
Google deberá implementar un sistema técnico que permita a los sitios web usar etiquetas de exclusión, similares a las ya existentes para el rastreo de búsquedas tradicionales. Estas etiquetas, como noindex o robots.txt, ahora podrán aplicarse específicamente para evitar que la IA de Google extraiga fragmentos o entrene modelos con el contenido. Los editores podrán configurar sus servidores para bloquear el acceso de los crawlers de inteligencia artificial, lo que implica cambios en la infraestructura de indexación de Google y en la forma en que sus algoritmos procesan la información pública.
La IA ahora pide permiso, como un niño en una tienda de caramelos 🍬
Ahora resulta que la inteligencia artificial, esa que todo lo sabe y todo lo puede, tiene que pedir permiso para usar los textos de los periódicos. Es como si un robot superdotado llegara a tu casa, se bebiera tu leche y usara tu wifi sin preguntar, y de repente le dices: oye, pide permiso antes de saquear la nevera. Google tendrá que morderse la lengua algorítmica y aceptar que no todo lo que brilla en internet es suyo.