除了娛樂和獲取資訊,原來睇電視都能夠學習新知識。Google AI 項目 DeepMind 和牛津大學的科研人員,利用人工智能技術製作了史上準確度最高的唇讀軟件。透過使用超過 5,000 小時,2010 年至 2015 年間播出的 BBC 電視節目,科學家訓練神經網絡去為影片加入註解,令 DeepMind 變成唇讀專家。
在隨機抽樣的 200 條片段中,人工智能唇讀的準確度達 46.8%,人類唇讀專家解讀同一片段,準確度則只有 12.4%。唇讀除了可以讓失聰人士明白我們的談話內容,科技公司例如 Google 亦可以用於消費者應用軟件,改善聲音辨識系統和靜音聽寫功能。這次牛津大學和 DeepMind 合作的科研成果,未來或會用於語音助理功能,用戶就毋須對著手機大大聲說出指令,只需口郁郁就可以。
來源:cnet