自今年 5月,前 Google 研究員吳恩達(Andrew Ng)加盟百度,並擔任首席科學家後,百度的發展一直受外界關注。近日百度突然向外界揭曉,他們已經開發出一種比 Apple 及 Google 等對手更準確的語音識別系統 — 百度 Deep Speech。
跟其他語音識別系統一樣,百度 Deep Speech 是一種深度學習的人工智能技術。系統就能夠識別出數字形式的聲音、圖片等數據。百度的研究團隊收集了 9600人共 7000小時的語音,並使用了疊加的物理學原理在語音樣本中增加了15 類噪音,使百度 Deep Speech 在噪音環境中更加準確。測試顯示該系統的出錯率比 Google Speech API,Wit.AI,微軟Bing Speech,以及 Apple Dictation 低 10%。另外,Deep Speech 比目前的語音識別系統亦更簡單。外界估計百度可能會在明年把 Deep Speech 技術整合到 Cool Box 使用。
資料來源: forbes