近日,曼哈顿联邦法院收到一份长达55页的诉状,代表近400家美国报纸的出版商联盟将OpenAI和微软告上法庭。原告名单涵盖《纽约每日新闻》等知名报纸,以及众多美国本地小报。出版商指控OpenAI和微软“系统性地、秘密地”爬取数百家新闻网站内容,包括付费墙后的文章,并复制到自己服务器用于训练ChatGPT和微软Copilot,还删除了版权管理信息。
这并非第一起AI版权诉讼,而是规模较大的一起。自2023年12月《纽约时报》率先起诉生成式AI公司后,起诉队伍不断壮大。2025年,迪士尼等起诉中国AI公司MiniMax;同年11月,德国慕尼黑法院判OpenAI侵权。2026年,CNN、Reddit等纷纷起诉相关AI公司,音乐平台Jamendo也起诉英伟达。从新闻到电影、音乐、文学等各个内容行业,AI的“数据饥渴”撞上了版权墙,成为一场结构性的产业冲突。
训练大语言模型需要海量数据,OpenAI创始人曾承认不使用受版权保护材料,训练领先的AI模型不可能。AI的商业模式建立在“免费获取数据”之上,而数据创造者靠内容谋生,双方利益完全对立。AI公司称是“合理使用”,版权方则认为是商业行为应付费。
对于普通用户短期影响不大,但企业用户或用AI进行商业活动的用户,官司结果关系到“合规成本”。目前AI版权领域“合理使用”边界存在法律不确定性,若法院判定AI公司大规模数据抓取不构成“合理使用”,行业规则将重写,AI公司要么支付巨额赔偿,要么与版权方谈授权,这几乎不可能。普通用户可能面临AI工具变贵,且未来AI模型可能面临“数据荒”。
编辑观点:美国此次近400家报纸集体诉讼将成AI版权法律标志性案例,推动行业寻求技术创新与内容创作的新平衡,我国相关规范也为市场健康发展提供保障。