現時要訓練 AI 模型,需要越來越多的「優質」數據才可以提升效能,除了社交媒體外,網上論壇也是個內容極豐富的地方。大型英文論壇 Reddit 最近就與 AI 企業簽訂授權,容許對方使用論壇上的內容訓練 AI 模型。
據報導指,Reddit 正與一間未具名的大型 AI 開發企業簽訂授權,將論壇上用戶參與的各種內容開放用於訓練 AI 模型。據指這個交易每年可以為 Reddit 帶來約 6,000 萬美元的收入。
其實 AI 企業擅自在網上「挖掘」數據用作訓練 AI 模型是一直以來的做法,不過也因此如常越來越多的版權爭議以及法律訴訟。今次正式與 Reddit 簽訂授權協議可以確保 AI 訓練可以有合法的基礎,避免未來進一步的爭議。當然論壇上的內容也許是網民擅自從其他地方複製過去而不是原創,這方面的問題相信未來仍然有待解決,不過至少暫時可以為 Reddit 帶來穩定的收入來源。
來源:Bloomberg