網路媒體推新標準 AI攫取資料需付費

多家網路媒體公司本周推出全新公開授權標準,旨在要求AI公司為從網路媒體攫取資料訓練AI而付費。rslstandard.org

Reddit、雅虎、Medium、Quora和People Inc.等多家網路媒體公司推出全新公開授權標準「真的簡單授權」(Really Simple Licensing,RSL),旨在制定人工智能(AI)付費機制,允許AI公司從其網站攫取資料以進行AI訓練。

RSL標準建立於robots.txt協議之上,該協議讓網路媒體提供「網路爬蟲」(web crawler)指引,說明網站哪些部份可以或不可以存取。新標準增添了許可和版稅條款,嵌入到媒體可能想要獲取報酬的電子書、視頻和訓練資料集裡。

建立RSL標準的幕後功臣是新成立組織「RSL共同組織」(RSL Collective),負責人之一是「簡易資訊整合」(Really Simple Syndication,RSS)共同開發者兼電子優惠券平台前執行長瓦爾特(Eckart Walther)。

瓦爾特向科技新聞網站The Verge指出,新標準旨在為網路建立一個「全新且可擴展的商業模式」,採納了RSS部份早期理念,定義授權和補償權利。

RSL標準支援不同授權模式,包括免費版本。網站可透過RSL標準要求AI公司支付訂閱費或「按次爬取」付費;也可實施「按次推理費用」,當AI模型引用某網站資料來生成回應時,就需付費。正在「爬取」網站作歸檔或搜尋引擎收錄等其他用途的機器人,可照常運作。

與不少標準一樣,RSL的成功取決於AI公司是否願意接受和採用。RSL共同組織認為,結合部份最大型網路媒體將令新標準更具吸引力。本報訊

科技-三藩市版