生成式 AI 的普及,肯定會令未來的互聯網充斥着自動生成的內容,而日後這些 AI 模型的開發,也可能會用到 AI 生成的內容來訓練。不過有研究發現,圖像生成模型如果這樣做的話,效果將會越來越差。
史丹福大學和萊斯大學的研究員最近發表一個報告,表示生成式 AI 模型的訓練需要使用「新鮮的真實數據」,否則效果將會越來越差,他們將這個狀況名爲「模型自噬障礙」,在每一個版本進化中,如果沒有足夠的新鮮數據,將註定會出現錯漏。
在重複利用 AI 生成圖像訓練後產生的圖像中,雖然仍然保留了大概形狀,但已經有不少肉眼可見的瑕疵,人臉也逐漸不似人形。就研究結果看來,如果要繼續開發 AI 模型,則仍然需要真人拍攝或者繪畫的作品去訓練才可以確保效果滿意,當然日後如果有新的技術解決這個問題,令開發過程不再需要真人創作者提供新內容,也不太令人以意外。
來源:PetaPixel