La Fundación Wikimedia, que opera Wikipedia, acuerda con grandes empresas tecnológicas que sus sistemas de inteligencia artificial puedan acceder a los contenidos de la enciclopedia a gran escala. Estas compañías, entre las que se encuentran Amazon, Meta y Microsoft, ahora pueden usar el vasto corpus de texto de Wikipedia para entrenar y mejorar sus modelos de lenguaje. El objetivo es establecer un marco que reconozca el valor de los datos generados por la comunidad y asegure una contribución económica sostenible para el proyecto.


El modelo busca compensar a la comunidad colaborativa

El acuerdo no implica una venta directa de datos, sino que establece un canal para que las empresas que usan intensivamente esta información para desarrollar inteligencia artificial puedan apoyar financieramente a Wikimedia. La fundación argumenta que es justo que quienes se benefician comercialmente de este conocimiento colectivo ayuden a mantener la infraestructura que lo hace posible. Este enfoque pretende proteger el acceso libre y gratuito para los usuarios humanos mientras se negocia con actores corporativos.

Los datos de Wikipedia son un recurso clave para entrenar IA

Los textos de Wikipedia, por su estructura, verificación y amplitud, son un conjunto de datos de alta calidad muy codiciado para entrenar modelos de lenguaje grandes. Hasta ahora, muchas empresas los extraían libremente. Este movimiento marca un punto de inflexión al intentar formalizar y monetizar ese uso específico. La estrategia podría inspirar a otros proyectos de contenido abierto a buscar caminos similares para sostenerse en la era de la inteligencia artificial.

Así que, mientras los bots aprenden de nuestra sabiduría colectiva, al menos algunos contribuirán a pagar la luz del servidor donde reside todo ese conocimiento.