
Meta 在 Llama 3 训练中使用盗版材料引发争议
《大西洋月刊》最近的一份调查报告揭露了 Meta 对其生成式 AI 模型 Llama 3 的训练实践中令人不安的真相。调查结果突显出,大量非法来源的书籍和学术论文在未经适当授权的情况下被使用。
人工智能开发缺乏伦理考量
在最初探索生成式人工智能的过程中,Meta 曾短暂考虑过通过合法手段获取数据集的前景。鉴于没有无数艺术家和学者的贡献,任何生成式人工智能都无法运作,人们可能会期待一种更合乎道德的方法。然而,正如这种情况所证明的那样,像马克·扎克伯格和萨姆·奥特曼这样的有影响力的科技人物似乎对他们的行为的影响漠不关心,做出的决定优先考虑利润而不是艺术完整性。
盗版指控详情
《大西洋月刊》的分析得到了最近披露的法庭文件的支持,该分析表明,Meta 的员工曾考虑正式授权各种文学作品,但最终认为这个过程要么“过于昂贵”,要么“极其缓慢”。由于生成式 AI 生态系统完全依赖现有材料,他们据称在扎克伯格的默许下选择从 LibGen 获取大量数据集——LibGen 是一个臭名昭著的盗版网站,拥有超过 750 万本书籍和 8100 万篇学术论文。
社区对危机的响应
Meta 涉嫌侵权的规模引发了作家们的愤怒,《大西洋月刊》的 Alex Reisner 为作家创建了一个资源,以便他们检查自己的作品是否被收录在 LibGen 数据库中。这项草根倡议承认,鉴于 LibGen 元数据可能存在不准确性,确定 Meta 下载总量存在困难。随着新闻通过 Threads 等平台传播,许多作家都表达了他们的沮丧和担忧。
文学界的声音
正如畅销书作家亚历山德拉·布雷肯 (Alexandra Bracken) 指出的那样,盗版的合理性通常以易获得性为借口。然而,盗版的影响远不止销售损失;它还体现了对知识产权控制权的丧失,其后果深远。布雷肯的深刻评论抓住了问题的关键:
“多年来,作者们一直被告知,盗版我们的作品是合理的,因为存在可访问性问题,盗版我们作品的读者永远不会购买正版。但问题不仅仅是销量的损失,而是我们对知识产权的控制权的完全丧失,这直接导致了这种情况。”
Karina Halle 也表达了她的苦恼,透露她的近 90 本书都受到了 Meta 行为的影响,并质疑人工智能开发过程的完整性:
“我的 89 本书(以及 19 本外国版)都出现在那个盗版网站上,Meta 已经从该网站抓取了这些内容,并将其作为 AI 数据。无话可说。”
同样,作家 AK Caggiano 也批评了 Meta 的做法,幽默地指出他们的人工智能推广写作辅助,而原创者却被边缘化,这具有讽刺意味:
“Meta 在我创建的帖子上推销他们的人工智能‘帮我写’的废话,现在更可笑了,因为你的意思是什么?我已经写好了!现在你想让我自己抄袭?”
Francesca Zappia 提出了有关报酬的问题,质疑 Meta 对作者在创作作品中付出的巨大努力的轻视态度:
“我的报酬在哪里,@meta?你合法获取数据需要‘太长时间’并且‘太昂贵’,但我花在创作和营销这些书上的时间、工作和金钱呢?”
呼吁立法变革
随着生成式人工智能技术的快速发展,立法者似乎在解决其带来的道德困境方面落后了。由于现行版权法被规避,创作者发现自己处于危险境地,而科技巨头则从他们的艺术劳动中获取经济利益。关于潜在集体诉讼的讨论正在获得关注,许多人主张改变行业解决这些问题的方式。问题仍然存在:我们是否希望未来文学和创造力被脱离实际的衍生内容所取代,这些内容缺乏真实的人类表达?
要了解有关该主题的更多见解和更多信息,请访问Source&Images。
发表回复 ▼