人工智能初創 Anthropic 日前發表 Claude 3 系列,提供 3 個大型語言模型,聲稱在多項基準測試中超越 Google Gemini 和 OpenAI 的 ChatGPT。Claude 3 提供 Haiku、Sonnet 和 Opus 三個版本,Anthropic 強調 Claude 3 在多方面都有出色表現,包括多模態能處理不同數據類型、準確性提升、上文下理的理解能力和反應時間。
早期 Claude 版本的其中一個限制,有時會迴避被認為有風險的指令,在新版本則獲得解決,新模型更願意解決具有挑戰性的問題。Claude 3 的三款模型中以 Opus 最為強大,非常適合處理大型操作。Anthropic 聲稱它在複雜任務中表現「理解以接近人類水平」,並通過「大海撈針」評估進一步展示其能力。在該評估中它以接近完美的準確性回憶信息。Opus 還擅長處理數學問題,能夠生成電腦代碼,其推理能力表現更比 GPT-4 優勝。
Claude 3 亦有其缺點,雖然 Anthropic 強調提高了準確性,但模型生成的事實錯誤信息,即「幻覺」的問題仍然存在,不過發生率比之前的版本顯著降低。此外,Opus 在回應查詢時會遇到一些延遲,表現出與早期 Claude 2 模型相若的速度。至於另外兩個版本則各有優勢,Haiku 在快速響應和從非結構化數據中提取信息方面表現出色,但面對複雜的數學問題時可能會遇到困難。Sonnet 是一個更大規模的模型,能夠協助用戶完成日常任務,甚至可以解析圖像中的文字。
目前,Sonnet 和 Opus 已經可供購買,而 Claude 的免費版本仍可在 Anthropic 的網站上使用。Haiku 的發佈日期尚未公布,但 Anthropic 表示很快就會發表。Claude 3 的主要目標受眾似乎是希望將工作流程自動化的企業,一般用戶可能會在網上聊天機械人中遇到這些模型。
資料及圖片來源:gizmochina