商湯新一代大模型“書生·浦語”2.0正式開源
2024-01-18 09:41:26
來源:通信世界全媒體 王鶴迦??
通信世界網消息(CWW)1月17日,商湯科技與上海AI實驗室聯(lián)合香港中文大學和復旦大學正式發(fā)布新一代大語言模型書?·浦語2.0(InternLM2)。InternLM2 的核心理念在于回歸語言建模的本質,致力于通過提高語料質量及信息密度,實現(xiàn)模型基座語言建模能力質的提升,進而在數(shù)理、代碼、對話、創(chuàng)作等各方面都取得長足進步,綜合性能達到開源模型的領先水平。
InternLM2是在2.6萬億token的高質量語料上訓練得到的。相比于初代InternLM,InternLM2的各項能力獲得全面進步,在推理、數(shù)學、代碼等方面的能力提升尤為顯著,綜合能力領先于同量級開源模型。根據大語言模型的應用方式和用戶關注的重點領域,研究人員定義了語言、知識、推理、數(shù)學、代碼、考試等六個能力維度,在55個主流評測集上對多個同量級模型的表現(xiàn)進行了綜合評測。
評測結果顯示,InternLM2的輕量級及中量級版本性能在同量級模型中表現(xiàn)優(yōu)異。沿襲第一代書生·浦語(InternLM)設定,InternLM2包含7B及20B兩種參數(shù)規(guī)格及基座、對話等版本,滿足不同復雜應用場景需求,繼續(xù)開源,提供免費商用授權。
InternLM2的輕量級及中量級版本性能在同量級開源模型中表現(xiàn)優(yōu)異
原創(chuàng)文章
最新文章
商務合作
- QQ:61149512