Meta 推出首款透過語音、圖像和文字學習的自監督演算法。由於無需依賴標籤資料學習,能有效處理更多元化的任務。
Meta 於官網聲明上宣布,推出首款高性能、自監督演算法 Data2vec,以多種方式學習語音、圖像和文字。與普遍透過標籤資料學習的機器有別,Data2vec 通過自我監督學習,從觀察語音、圖像和文字的結構學習,能以更有效的方法處理包括理解口語文字等的複雜任務。
AI 會分別扮演「老師」與「學生」的角色,「老師」會得到一張小狗的相片,它會把相片的頭部蓋住,然後要求「學生」去預測這張圖片是甚麼,再交出答案。通過無數次這樣的預測令 AI 從中學習。在文字的學習上也是相同。
Data2vec 以統一的方法來預測輸入語音、文字或音頻數據,使單個算法亦能處理不同類型的數據輸入,解決了現時自監督學習算法因無法處理多款數據而使用受限的問題。
由於 Data2vec 並非依賴標記資料學習,有助它學習世上更多不同範疇的知識,令人工智能可透過影片、文章和錄音學習複雜的主題,例如足球比賽及不同的烘焙方法。此外,Data2vec 亦有助人類開發適應性更強、能執行更難和多多元化任務的人工智能。
資料來源:Meta
—
unwire.hk Mewe 專頁 : https://mewe.com/p/unwirehk