Google上周三(12 月 6 日)發佈了自主研發的人工智能模型 Gemini ,劍指 OpenAI 的 GPT-4。不過近日有網友質疑其示範影片真偽,最終日前《Bloomberg》記者揭露其影片曾作大幅度剪輯,實際 Goolge 的 Gemini 並非如影片般運作,而且無論其回應篇幅及速度均曾被 Google 大幅度編輯。
Google 上周在 YouTube 上傳了一段有關旗下 AI「Gemini」的示範影片,示範 Gemini 能夠以多種語言及視覺理解內容,以回應用家輸入的各種內容或指令。
Google 上傳的影片顯示,Gemini 能夠判斷用家在便利貼上畫的東西。
▲示範者首先在便利貼上繪畫了一條曲線,Gemini 回應指其看到一條曲線
▲隨後示範者再在便利貼上加了數筆,Gemini 表示看到一些很平滑的輪廓線條
▲加上了眼睛和蹼後,Gemini 就認得這是隻鳥
▲示範者再加上了波浪,Gemini 終於認出這是隻鴨
▲示範將鴨子填成藍色,Gemini 會回應指藍色的鴨子很罕見
之後 Gemini 亦示範了能夠理解包剪揼遊戲、可以猜出紙球被藏在哪個杯子下面,種種表現均是為了示範 Gemini 可以和人類以不同形式互動。然而,正因為 Gemini 表現如此出眾,引來網民質疑其真實性。《Bloomberg》的記者 Parmy Olson 就是其中一個質疑 Gemini 實際能力的人。
面對傳媒質詢,Google 其後其後亦坦言上傳至 YouTube 的影片並非實事拍攝,而是運用原始拍攝影片的截圖,再輔以文字提示,以使 Gemini 可以作出相應回應。Google DeepMind 副總裁 Eli Collins 回應指,YouTube 上的示範影片中,工作人員開頭繪畫鴨子讓 Gemini 辨認的功能實際上仍然處於研究階段,目前不是 Google 任何一款實際產品。
除此之外, Google 在 YouTube 上傳的影片下方亦補充指:「為達到示範目的,影片中 Gemini 生成時的延遲部分經縮時快鏡處理,Gemini 的生成的內容亦因要達示範目的而曾作刪減(For the purposes of this demo, latency has been reduced and Gemini outputs have been shortened for brevity)」
Google 亦回覆《Verge》指,是次的影片主要是希望向開發人員展示 Gemini 如何產生多種不同的使用體驗。Google 亦強調影片並非造假,測試團隊有實際向 Gemini 提供圖片及文字提示,以測試其推理力。