Google 推出雲端文字轉語音 API 讓讀音更自然

智能助手應用普及,對於文字轉語音的要求也逐漸提升。Google 近年有推出雲端人工智能機器學習服務,最近就公佈推出新的文字轉語音 API,可以把文字變成自然的發音,支援各種語音應用需求。

這個雲端文字轉語音(Text-to-speech)API 可以,支援 12 種語言並轉變成 32 種自然語言,把電腦中的書面內容,變成口語形式讀出。而這個 API 亦配合新的 WaveNet 發音模型,令讀音變得更加自然而準確,運算速度比原先快 1,000 倍,只需要 50 毫秒就可以運算出 1 秒鐘的語音訊息,而且讀音樣本的解析度亦由 8 位元提升到 16 位元。Google 表示在美式英文 WaveNet 的測試中,有超過 20% 的人認為電腦讀音比真人讀音要好。

現時不同的物聯網或者智能助手,也需要用到文字轉語音服務,Google 自家的服務例如地圖、搜尋等都有內置文字轉語音服務,而現在推出了 API 之後,第三方的物聯網應用例如電視、汽車等都可以受惠於這個技術,令電腦與用家之間的互動可以更加自然流暢。

來源:Google

Leave a Comment