法官裁定OpenAI須交盜版書庫紀錄

曼哈頓聯邦法院地方法官王安娜(Ona Wang,音譯)裁定,OpenAI須提交所有與公司律師往來、涉及刪除兩組大型盜版書籍數據庫的內部通訊。她指出,OpenAI對刪除原因多次改口,已無法主張屬律師與客戶間保密範圍。

《每日新聞》報道,法官在28頁裁決中指,OpenAI持續否認蓄意侵犯版權,而陪審團有權了解其所稱「善意行為」的依據,「既然OpenAI將其主觀意圖置於爭議中心,便不得選擇性以保密特權阻礙原告查證其善意依據。」

此案為針對微軟與OpenAI的合併集體訴訟,原告包括《每日新聞》、多家隸屬Tribune Publishing與MediaNews Group的報章及多個傳媒機構,指控兩家公司侵害版權。

判決聚焦另一組原告,包括美國作家協會(Authors Guild)及暢銷作家馬丁(George R.R. Martin)、葛里森(John Grisham)等。原告指,OpenAI利用臭名昭著的網上「LibGen」影子圖書館的盜版書籍訓練AI模型,相關檔案為員工於2018年下載。該書庫曾兩度被法院勒令關閉。

在取證程序中,原告發現OpenAI於2022年刪除了名為「Books1」及「Books2」的兩組書庫,被認為包含逾10萬冊書籍,且在訴訟展開前一年已移除。OpenAI當時聲稱刪除理由是「未使用」,並稱這是唯一刪除過的訓練數據集。然而,當原告要求查詢刪除原因時,OpenAI又主張屬律師保密特權,且其立場多度轉變。

法官下令OpenAI須交出她已審閱的通訊、所有與內部律師有關刪除原因的書面往來,以及所有涉及LibGen而先前遭刪改或被扣留的內部紀錄。

作家協會及OpenAI律師團未回覆查詢。OpenAI發言人表示「不同意裁決並打算上訴」。本報訊

紐約