
自由软件基金会(FSF)近日针对Anthropic公司使用其材料训练AI模型一事发声,敦促该公司开放其大语言模型。
在版权侵权诉讼Bartz诉Anthropic案中,FSF与许多其他版权持有者一样收到了和解通知。为解决这起集体诉讼,Anthropic公司于9月同意设立15亿美元基金,用于补偿那些作品被用于训练模型却未获得许可的作者。
当时,Anthropic在案件的某些方面获得了早期胜利——技术精通的法官William Alsup表示,使用书籍训练大语言模型属于"合理使用",但对于为此目的下载这些书籍是否合法的问题仍悬而未决。各方选择和解而非等待审判,版权持有者现在收到现金赔偿提议以替代潜在损害赔偿。
Anthropic使用的数据集中包含萨姆·威廉姆斯的作品《自由如自由:理查德·斯托曼的自由软件十字军》。据FSF称,该书由O'Reilly和FSF根据GNU自由文档许可证(GNU FDL)发布。
FSF写道:"这是一个允许为任何目的免费使用作品的自由许可证。"
"显然,正确的做法是保护计算自由:与大语言模型的每个用户分享完整的训练输入,连同完整的模型、训练配置设置和相应的软件源代码。"
"因此,我们敦促Anthropic和其他使用从互联网下载的大型数据集训练模型的大语言模型开发者,向用户自由提供这些大语言模型。"
虽然用户在等待奇迹发生——AI供应商不太可能满足FSF的要求(尽管The Register已向Anthropic征求评论)——FSF表示它没有资源进行旷日持久的法律战。不过,如果它参与像Batz诉Anthropic这样的诉讼,并发现其版权和许可证被违反,"我们肯定会要求用户自由作为补偿。"
这是值得称赞的,但考虑到有多少开源内容(代码或其他)已经被AI供应商吸收,这匹马早在任何人想到关闭马厩门之前就逃跑了。
这种指责不太可能感动包括Anthropic在内的供应商,除非未来的诉讼真正进入审判阶段而不是以和解告终。
更新内容:
自由软件基金会(FSF)发言人告诉The Register,其意图是"强调一个更广泛的原则:当大语言模型使用从互联网提取的庞大数据集开发时,对用户最好的结果是保护和扩展用户自由。"
FSF补充说:"FSF根据保证四项基本自由的许可证发布其作品:使用、研究、修改和分享作品的自由。我们关心的不是限制使用,而是确保这些系统的开发和分发为所有用户尊重这些相同的自由。"
Q&A
Q1:Anthropic公司为什么要设立15亿美元基金?
A:Anthropic公司为解决版权侵权集体诉讼Bartz诉Anthropic案,同意设立15亿美元基金,用于补偿那些作品被用于训练AI模型却未获得许可的作者。
Q2:自由软件基金会对AI公司有什么要求?