
Meta 在 Llama 3 訓練中使用盜版材料引發爭議
《大西洋月刊》最近的一份調查報告揭露了 Meta 對其生成式 AI 模型 Llama 3 的訓練實踐中令人不安的真相。
人工智慧開發缺乏倫理考量
在最初探索生成式人工智慧時,Meta 曾簡要地考慮透過合法手段取得資料集的前景。鑑於沒有無數藝術家和學者的貢獻,任何生成式人工智慧都無法運行,人們可能會期待一種更符合道德的方法。然而,從這種情況可以看出,馬克·祖克柏和薩姆·奧特曼等有影響力的科技人物似乎對其行為的影響漠不關心,做出的決定優先考慮利潤而不是藝術完整性。
盜版指控詳情
《大西洋月刊》的分析以最新披露的法庭文件為依據,指出 Meta 的員工曾考慮對多部文學作品進行正式授權,但最終認為這一過程「過於昂貴」或「極其緩慢」。由於生成式 AI 生態系統完全依賴現有資料,據稱,在祖克柏的默許下,他們選擇從 LibGen 獲得大量資料集——LibGen 是一個臭名昭著的盜版網站,擁有超過 750 萬本書和 8, 100 萬篇學術論文。
社區對危機的回應
Meta 涉嫌侵權的規模引發了作家們的憤怒,《大西洋月刊》的 Alex Reisner 創建了一個資源,供作家們查看他們的作品是否被收錄在 LibGen 資料庫中。鑑於 LibGen 元數據中可能存在的不準確性,這項草根倡議承認確定 Meta 下載總量存在挑戰。隨著消息透過 Threads 等平台傳播,許多作者都表達了他們的沮喪和擔憂。
文學界的聲音
正如暢銷書作家亞歷山德拉·布雷肯 (Alexandra Bracken) 指出的那樣,盜版的合理性常常以可訪問性為藉口。然而,其影響不僅限於銷售損失;它體現了對知識產權控制的喪失,其影響深遠。布雷肯的深刻評論抓住了問題的關鍵:
「多年來,作者們一直被告知,盜版我們的作品是合理的,因為存在可訪問性問題,盜版我們作品的讀者永遠不會購買正版。但問題不僅僅是銷量的損失,而是我們對知識產權的控制權的完全喪失,這直接導致了這種情況。”
Karina Halle 也表達了她的苦惱,透露她的近 90 本書都受到了 Meta 行為的影響,並質疑人工智慧開發過程的完整性:
「我的 89 本書(以及 19 本外國版)都出現在那個盜版網站上,Meta 已經從該網站抓取了這些內容,並將其作為 AI 數據。無話可說。”
同樣,作家 AK Caggiano 也批評了 Meta 的做法,幽默地指出他們的人工智慧推廣寫作輔助,而原創者卻被邊緣化,這具有諷刺意味:
“Meta 在我創建的帖子上推銷他們的人工智能‘幫我寫’的廢話,現在更可笑了,因為你的意思是什麼?我已經寫好了!現在你想讓我自己抄襲?”
Francesca Zappia 提出了有關報酬的問題,質疑 Meta 對作者在創作作品中付出的巨大努力的輕視態度:
“我的報酬在哪裡,@meta?你合法獲取數據需要‘太長時間’並且‘太昂貴’,但我花在創作和營銷這些書上的時間、工作和金錢呢?”
呼籲立法變革
隨著生成式人工智慧技術的快速發展,立法者似乎在解決所帶來的道德困境方面落後了。由於現行版權法被規避,創作者發現自己的處境很危險,因為科技大亨們從他們的藝術勞動中獲取了經濟利益。關於潛在集體訴訟的討論正在獲得關注,許多人主張產業改變解決這些問題的方式。問題依然存在:我們是否希望未來文學和創造力被缺乏真實人類表達的脫離實際的衍生內容所取代?
要了解有關該主題的更多見解和更多信息,請訪問Source&Images。
發佈留言 ▼