你曾經試過因群組之中過多人同時講話,難以辨識同伴的聲音嗎?近日,有研究團隊藉深度學習演算法找到說話的人的位置,用相反的聲波來降低聲音,令群組每個人都可以清晰聆聽別人的說話。
華盛頓大學(University of Washington )的研究團隊研發出一種可自動將吵雜環境隔出「說話區」的揚聲器,揚聲器系統共有 7 部小型咪高風機械人研究員將其稱之為「音訊群」(acoustic swarm)。
當有人說話時,聲音會先傳到最近的咪高風機械人,透過延遲的訊號和深度學習演算法,鎖定說話者的位置,說話者周遭的機器人咪高風可藉降噪耳機的原理,用相反的聲波來降低聲音。
研究團隊在工作空間、客廳和廚房等場所進行了實驗,結果顯示,即使說話者之間只相隔 50 厘米,咪高風機械人仍然能夠準確識別不同人的聲音,識別準確度達到 90%。系統處理速度也相當迅速,能夠在 1.82 秒內處理 3 秒的語音。
實驗在工作空間、客廳和廚房等場域進行,結果顯示當說話的人彼此只相隔 50 厘米,咪高風機械人還是能辨識出不同人的聲音,精準度達 90%,系統處理速度花費 1.82 秒處理 3 秒的語音。研究團隊也在持續發展此技術,希望能達到真實的靜音,讓在空間中不同區域的人可聽到不同的數位音訊。
資料來源:acousticswarm
圖片來源:acousticswarm