本報訊
OpenAI早在2024年5月時表示,正在開發一款工具,讓創作者可以指定他們希望自己的作品如何納入或排除在其AI訓練數據中。但截至目前,這項功能仍未面世。
據OpenAI當時表示,該工具名為媒體管理器(Media Manager),可以「識別受版權保護的文本、圖像、音頻和視頻」,以反映創作者「跨多個來源」的偏好。它旨在避開公司一些最激烈的批評者,並可能保護 OpenAI 免受與知識產權相關的法律挑戰。但據智通財經報道,有知情人士透露,該工具在內部很少被視為重要發布。「我不認為這是一個優先事項」,一位前 OpenAI員工說,「說實話,我不記得有人在開發它。」一位負責協調公司工作的非員工去年 12月透露,他們過去曾與OpenAI討論過這款工具,但最近沒有任何進展。而OpenAI法律團隊中一位曾擔任媒體經理的Fred von Lohmann則於去年10月轉任兼職顧問。報道指,OpenAI尚未公布媒體管理器的進展情況,該公司錯過了自己設定的「2025年之前」推出該工具的最後期限。
ChatGPT可以寫出令人信服的電子郵件和文章,而OpenAI的視頻生成器Sora可以製作相對逼真的鏡頭。能夠借鑒寫作、電影等範例來創作新作品,讓人工智能變得異常強大。但它也有反芻性,當以某種方式提示時,模型(其中大多數是在無數網頁、視頻和圖像上進行訓練的)會生成這些數據的近似副本,儘管這些數據是「公開的」,但並不適合以這種方式使用。
這自然會讓那些作品未經許可就被納入人工智能訓練的創作者感到不安。許多人已經聘請了律師。
OpenAI正在應對藝術家、作家、YouTube用戶、電腦科學家和新聞機構提起的集體訴訟,所有這些人都聲稱這家初創公司非法訓練他們的作品。原告包括作家Sarah Silverman和Ta Nehisi-Coates、視覺藝術家以及《紐約時報》和加拿大廣播公司等媒體集團。據悉,OpenAI已與精選合作夥伴達成許可協議,但並非所有創造者都認為這些條款具有吸引力。
OpenAI為創作者提供了幾種「退出」其AI訓練的臨時方式。去年9月,該公司推出了一個提交表單,允許藝術家標記他們的作品,以便從其未來的訓練集中刪除。而且OpenAI長期以來一直允許網站管理員阻止其網絡爬蟲程序在其域中抓取數據。但創作者批評這些方法雜亂無章,不夠充分。對於書面作品、視頻或錄音,沒有具體的退出機制。而對於圖像的退出表格則要求提交每張要刪除的圖像的副本以及說明,這是一個繁瑣的過程。
如今,媒體管理器被宣傳為OpenAI退出解決方案的徹底改進和擴展。OpenAI在5月的公告中表示,媒體管理器將使用「尖端機器學習研究」,使創作者和內容所有者能夠「告訴[OpenAI]他們擁有甚麼」。OpenAI聲稱在開發該工具時正在與監管機構合作,並表示希望媒體管理器能夠「為整個AI行業樹立標準」。從那以後,OpenAI再也沒有公開提及過媒體管理器。