谷歌懸賞揭露AI產品漏洞

谷歌宣布新懸賞計劃,用於找出AI產品的安全漏洞,圖為執行長皮蔡今年5月在I/O大會上介紹各項AI新功能。美聯社資料圖片

谷歌宣布啟動一項全新的獎勵計劃,專門用於尋找其人工智能( AI) 產品中的安全漏洞。

谷歌列出的符合獎勵資格的漏洞包括了一些它正在尋求的「惡意行為」(rogue actions)範例,例如:間接植入一個AI提示(prompt),導致智能家居平台Google Home 解鎖門鎖;或是利用數據外洩提示注入(data exfiltration prompt injection),將某人所有電子郵件內容總結後,發送到攻擊者本人帳戶。

這項新計劃明確定義AI漏洞並將其分類,包括利用大型語言模型或生成式AI系統,來造成損害或利用安全漏洞的問題,其中「惡意行為」被列為漏洞清單之首。這包括修改某人的帳戶或數據以妨礙其安全,或不受用戶歡迎的行為,例如早前曾被披露揭露的一個漏洞:透過一個操控的谷歌日曆來打開用戶家中智能百葉窗並關閉電燈。

谷歌宣稱,從兩年前開始邀請AI研究人員在其產品中根除可能濫用AI功能的潛在途徑以來,漏洞獵人已累計獲得超過43萬元的獎金。新計劃按漏洞規模及重要性發出懸賞,每份獎金從谷歌AI服務信用到最高2萬元不等。本報訊

科技-三藩市版