三十年来,数字档案库Wayback Machine已保存超过十亿个网页,成为记者、历史学家和律师的重要工具。但当前的威胁并非来自政府或黑客,而是媒体自身。根据尼曼基金会的数据,至少来自九个国家的241家媒体机构——包括《卫报》、《纽约时报》和《世界报》——已阻止该档案库的爬虫访问其内容。
数据保存与保护的技術困境 🛡️
封锁的根源在于担忧OpenAI或谷歌等人工智能公司未经许可或补偿地使用这些材料训练其模型。《纽约时报》指控其存档内容被AI公司用于侵犯版权。此外,AI机器人每秒向archive.org服务器发送数万次请求,导致其基础设施不堪重负。这个倡导开放互联网的组织,正面临在坚守理念的同时抵御此类实践的挑战。
反噬援手之手的讽刺 😅
颇具讽刺意味的是,像《今日美国》这样曾利用该档案库找回丢失文章的媒体,如今却关上了大门。这好比消防员救了你的房子,你却因担心他偷沙发而禁止其入内。与此同时,AI机器人仍在虚拟队列中等待,而archive.org则夹在其利他使命与现实之间,宛如一场人人都想参加却无人愿付门票的派对主人。