OpenAI 宣布開發出一款創新的生成式人工智能,名為「Voice Engine」,能夠精準模仿人類的聲音。這項技術僅需短短 15 秒的語音樣本,便能合成極為相似的聲音,並支援多語言轉換。OpenAI 強調對此技術的安全應用抱持謹慎態度,並未立即公開,而是選擇先進行試驗性應用以確保安全。
OpenAI 在推出開發對話型 AI 「ChatGPT」後再次推出能夠復刻人聲的「Voice Engine」。只需要 15 秒的語音樣本和文字輸入,即能製作出與原聲極為相似的語音輸出,甚至能轉換成非母語的外語發音。
「Voice Engine」技術不僅能實現更真實的人聲復刻,而且還能應用於各種場景,如為孩童朗讀故事、企業產品介紹、醫療諮詢服務,以及為語言障礙者提供幫助,支援多種語言,且能模仿語調和情感。
合成語音技術同樣會擔心會被濫用。為此 OpenAI 決定不急於完全公開「Voice Engine」。公司強調生成逼真人聲帶來的風險巨大,尤其在選舉期間,需要格外小心。OpenAI 正與政府和外部企業合作,並採取必要的安全措施。
OpenAI 於 2 月推出了視頻生成 AI 「Sora」,該技術同樣未對外公開。面對生成型 AI 技術日益普及所引發的濫用風險,OpenAI 對商用化明顯採取較審慎態度,以確保安全和負責任的使用。
官方網站上展示了詳細應用方式。