AI 已成各大科技巨頭兵家必爭之地,商湯科技稍早時分發布了升級「日日新SenseNova 5.0」大模型。商湯董事行政總裁徐立表示,「日日新SenseNova 5.0」能力達到甚至超越 GPT-4 Turbo。據港台報道,今晨商湯股價炒高逾 3 成,其後因需要刊發「可能構成內幕消息的公告」,於 11:15 分暫停買賣。
據《信報》報道,商湯「日日新SenseNova」大模型目前已推出第 5 個大版本。徐立表示「日日新5.0」表示使用逾 10TB Tokens 訓練,運用了大量合成數據,並採用混合專家架構,推理時上下文窗口可以有效可達 200K 。「日日新5.0」主要增強了知識、數學、推理及代碼能力。
徐立在發布會上示範了部分「日日新5.0」的功能,據《信報》報道指,「日日新5.0」示範時曾與 Open AI GPT-4 結果作對比。徐立表示「日日新5.0」綜合能力劍指 GPT-4,期間曾以高考作文題目示範,表示「日日新5.0」可以融入更多中國文化元素,寫作風格比 GPT-4 更加自由。
《on.cc》報道指,商湯表示由於「日日新SenseNova 5.0」大模型非常成功,深受市場關注,因此按照港交所建議刊發「可能構成內幕消息的公告」並於中途停牌。