Categories: 社交網絡

Facebook 開發 AI 翻譯模型 支持過百語言、打算開放程式碼

Published by
唐美鳳

Facebook 的動態消息自動翻譯功能,每天為全球用戶翻譯約 200 億條內容,無論貼文是用什麼語言發出,Facebook 基本上都能夠翻譯,只是翻譯結果可能會詞不達意或出現謬誤。原因之一是自動翻譯功能以英語作為中介,例如法語內容先要翻譯成英語,再翻譯成我們常用的中文。

以英語作為中介是因為英語的翻譯資料集非常龐大,不過亦因為經過了中介,翻譯誤差的機會因此增加。翻譯的準確性減低之餘,整個翻譯過程亦變得複雜繁瑣。Facebook AI 開發新的機器翻譯模型,希望能夠解決上述問題。要創建翻譯數據資料庫,以往是要找同時懂得兩種語言的人,但這種做法相當困難,同時亦難以擴張規模。

Facebook AI 開發的機器翻譯模型,能夠在不使用英語的情況下,直接進行雙語雙向翻譯,而翻譯結果將會基於 BLEU 指標,一個為了評估機器翻譯而開發的指標,表現將會較利用英語作為中介的模型更佳。Facebook 這個做法要克服的問題不少,例如使用人數較少的語言,是否能夠收集到足夠的文本數據,就會影響機器學習的資源量。為此 Facebook 正在將資料集、模型訓練等資料改為開源,而協助這項技術能有更進一步發展。

來源:buzzorange

Published by
唐美鳳