ChatGPT 除了引爆了美國科技界的生成式 AI 開發熱潮之外,中國的科技企業也相當着緊,有報導指華為也已經準備公佈大型多模態 AI 模型,預計在下月公佈。
消息透露,這個名為「盤古 Chat」的大型 AI 模型擁有幾千億參數,預計對話能力可達 GPT-3.5 的水平。這個新的模型將會是華為「盤古系列 AI 大模型」的一員,這個系列早在 2021 年推出,去年升級到 2.0 版本。
「盤古 Chat」將會主要針對政治和企業應用而設,並非像 ChatGPT 一樣直接向一般消費者開放。分析指華為比其他中國科技企業擁有更完整的產業鏈和算力調配能力,之前在訓練千億參數的盤古大模型時就採用了逾 2,000 個自家「昇腾 910」商用 AI 晶片,華為也曾表示 3 年間的大模型訓練成本高達 9.6 億人民幣,所費不菲。預計「盤古 Chat」將會在 7 月的華為雲開發者大會上公佈,屆時將會有進一步的消息。
來源:cnBeta