外國傳媒日前報導指加州律師事務所 Clarkson Law Firm 最近向 OpenAI 提出集體訴訟,指控對方透過在未經同意下偷取數以百萬計網民,包括任何年齡兒童的可識別身份個人資料,用作訓練人工智能聊天機械人 ChatGPT 和圖像生成工具 Dall-E。
該律師事務所指 OpenAI 為了訓練大型語言模型,從互聯網搜刮 3,000 億文字,包括個人資料、Twitter 和 Reddit 等社交媒體帖文。律師事務所聲稱 OpenAI 秘密行事,未有如現行法律要求般註冊成為數據的經紀人。OpenAI 如何收集和使用哪些數據去訓練和開發 ChatGPT,一直都備受爭議,直到 4 月才提供選項,讓用戶拒絕將通話內容和個人資料提供予 ChatGPT 使用。
雖然今次集體訴訟主要針對 OpenAI 未經同意下,於網絡搜集原意不是與 ChatGPT 分享的數據,但有關不透明的用戶私隱政策亦涵括在內。律師事務所認為 OpenAI 藉此獲得 Microsoft 的大量注資,加上從 ChatGPT Plus 訂戶牟利,但未有向數據的來源作出補償。訴訟中的指控多達 15 項,包括侵犯私隱、未能保障個人數據、通過非法獲取大量個人資料去訓練模型等。
資料及圖片來源:mashable