人工智能自動翻譯系統發展都是,效果已經越來越好,不過目前的技術仍然是基於文字來進行翻譯,並非直接透過語音進行。最近 Meta 就開發出無文字翻譯系統,就算沒有標準的文字書寫系統,也仍然可以訓練 AI 模型。
Meta 表示,新推出的「通用語言翻譯工具」(Universal Speech Translator, UST)是全世界首個人工智能「口語對口語」翻譯系統,可以對應沒有標準書寫系統以及缺乏專業翻譯人員的語言,直接進行翻譯。
(1/3) Until now, AI translation has focused mainly on written languages. Universal Speech Translator (UST) is the 1st AI-powered speech-to-speech translation system for a primarily oral language, translating Hokkien, one of many primarily spoken languages. https://t.co/onYKQ8uoKN pic.twitter.com/Iy8MRMOypQ
— AI at Meta (@AIatMeta) October 19, 2022
他們首個應用這個技術的語言,就選擇了台語(閩南語)和英語的組合,系統已經可以對於兩個語言之間的對話進行自動翻譯和發音,Mark Zuckerberg 更親自示範這個技術。Meta 表示,對於這種口耳相傳的語言,在收集資料、設計模型和評估準確度的時候相當困難,需要首先利用「語音探勘」技術分析語音,然後配對閩南語和中文,再翻譯到英文增加到訓練資料庫,中間也加入自己的拼音系統來評估準確度。Meta 表示未來這個技術可以擴充到其他語言,也將會公開「大型語音翻譯語料庫」(LASER)讓其他研究人員使用。
來源:Facebook