
维基媒体基金会与科技巨头达成协议,让其AI访问维基百科
管理维基百科的组织已与科技行业的重大公司达成谅解。这些公司现在可以使用百科全书的庞大文本档案来训练和改进其人工智能语言模型。目标是定义一个系统,认可由贡献者创建的信息价值,并确保持续的财务支持。🤝
一种回报知识生成者的模式
这一协议并非直接的数据交易。更确切地说,它为那些大规模使用此内容来开发人工智能的公司开辟了一条途径,让它们向维基媒体提供经济资源。基金会认为,那些从这一集体知识中获得商业利益的人帮助维护使其成为可能的的基础设施是公平的。这种方法旨在在与企业实体谈判的同时,保障人们免费访问。
协议的关键细节:- 不是数据销售,而是建立的财务支持渠道。
- 亚马逊、Meta 和微软等公司参与其中。
- 旨在保护人类用户的免费访问。
那些从这一集体知识中获得商业利益的人帮助维护使其成为可能的基础设施是公平的。
维基百科的文本,对AI来说是宝贵资源
百科全书的文章因其连贯结构、事实核查和主题广度,代表了一个高质量信息集合,非常受大型语言模型训练的欢迎。到目前为止,许多公司免费提取它们。这一举措标志着一种转变,试图正式化和从这种具体使用中获得收入。这一策略可能激励其他开放内容举措探索类似途径,以在AI时代维持自身。
这些数据为什么宝贵:- 提供结构、核查和主题广度。
- 是训练语言模型的高质量集合。
- 企业的大规模使用现在寻求正式化。
一个具有数字互惠的未来
这一方法确立了一个重要的先例。当自动化系统从数千人积累的智慧中学习时,至少一部分将其商业化的行为者将有助于支付托管所有这些知识的服务器成本。这是朝着更平衡的数字生态系统迈出的一步,在那里,一个社区生成的价值可以维持其自身的存在和增长。💡