超過 9 成準確度，Google 推出新版本照片標題辨識技術

2016-09-24

Published by

藍骨

圖像辨識一向是人工智能的重要技術之一，要準確地描述圖片的內容，就算是真人可能也要想一想，要由電腦算法推算，就更加困難，不過 Google 看來已經對此技術有一定的突破。

Google 最近向開發者開放了一個「Show and Tell」算法，可以在經過訓練之後，辨認出圖片上的物件並自動寫下標題，準確到高達 93.9%，這比上一代算法只有 89.6% 準確度已經改善了不少。這個新技術採用 Google 的第三代「Inception」模式，可以更有效的辨認出照片內的不同物件，而且可以用庚子演的方式表達，例如描述草皮的顏色和小狗與飛碟之間的關係。

Google 表示，這個系統可以提供更加深層的圖片認知，例如就算是幾張小狗在海灘上的照片，都可以看出各自的分別，從而計算出相近但不同的標題。這樣的技術可以有很廣泛的應用，例如自動製作為弱視人士的輔助文字、協助歷史學家研究文獻、改善人工智能技術等等。要得到這個算法的原始碼，需要使用 Google 的 TensorFlow 系統，而且人工智能的訓練需要自行處理，相信要看到實際可用的應用，仍然需要等上一段時間。

來源：Google Research

Published by

藍骨

10 年前 ago