近月城中熱話 ChatGPT 最近又升級了!開發公司 OpenAI 推出了升級版全新語言模型 GPT-4,於香港時間今天(14 日)凌晨 4 時在 YouTube 直播,比較全新的 GPT-4 與舊版有何不同,同時亦開放 GPT-4 API 予開發者,但現階段須加入等候清單。
OpenAI 指, GPT-4 是一個大型多模態模型(Large Multimodal Model),能夠接受圖像及文字輸入,並以文字輸出答案。OpenAI 表示,雖然在現實世界的複雜場景下, GPT-4 推理能力和創造力還未及人類,但在各種專業領域考試上的表現已接近人類水準。
更聰明更準確
OpenAI 表示, GPT-4 比 GPT-3.5 更具創造性,能夠本處理更細微的指令。
一般輕鬆使用下, GPT-3.5 與 GPT-4 之間的區別不算大,但當工作的複雜性達到一定水平時,差異就會變得明顯— GPT-4 會比 GPT3.5 更加可靠。
為比較 GPT-4 和 GPT-3.5 兩代模型之間的差異,OpenAI 在沒有為 GPT-4 提供針對性訓練的前提下,拿了超過 30 種考試的試題供 GPT-4 回答。
▲ GPT-4 考試成績
以上的成績顯示,如果 GPT-4 是人類,的話,絕對有能力通過美國大部份大學測驗。除了 AP (Advanced Placement,美國大學先修課程)外,GPT-4 的成績 GPT-3.5 根本望塵莫及。
OpenAI 同時亦以 GPT-4 與市面上的其他大型語言模型比較。數據顯示,GPT-4 的性能大幅拋離現有的大型語言模型,其中有些模型更是針對專門的範疇製作或進行訓練。
▲ GPT-4 與市面上其他大型語言模型的比較
支援圖像輸入
另一個 GPT-4 比 GPT-3.5 更優勝的地方是,GPT-4 現在支援圖片輸入,與原本 GPT-3.5 或以前的版本只能以文字輸入的模式相比有很大進步。GPT-4 甚至能夠解讀迷因(Meme)!
▲用戶可以將迷因傳送給 ChatGPT,並叫它分析這個迷因有甚麼好笑之處。
▲GPT-4 版本的 ChatGPT 能分析這張圖片的幽默之處。 ChatGPT 稱,這張圖片的幽默感源於以過時的巨大 VGA 連接器插入現代小型智能手機充電口的荒謬性。
除了以上兩項大更新外,OpenAI 表示 GPT-4 亦有其他更新,例如大幅減少了杜撰答案胡亂回答的機率、對敏感問題的回應更加成熟、以及每 1,000 個提示 token 花費更低;但 GPT-4 仍然只能提供 2021 年或以前的資料。
OpenAI 表示已經與包括語言學習應用程式 Duolingo、支付服務供應商 Stripe 和非營利教育機構 Khan Academy 等多家公司合作,將 GPT-4 導入他們的產品。GPT-4 的 API 亦開放予 ChatGPT Plus 訂戶,開發者可以加入等候清單,使用 GPT-4 開發應用程式。Microsoft 亦同步表示,已提前一個半月將 GPT-4 導入 Bing Chat功能。
資料來源:OpenAI