上證報中國證券網(wǎng)訊(記者 劉怡鶴)10月30日,昆侖萬維宣布開源百億級大語言模型“天工”Skywork-13B系列,并配套開源了600GB、150B Tokens的超大高質(zhì)量開源中文數(shù)據(jù)集。
昆侖萬維天工Skywork-13B系列目前包括130億參數(shù)的兩大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,它們在CEVAL、GSM8K等多個權(quán)威測與基準(zhǔn)測試上都展現(xiàn)了同等規(guī)模模型的最佳效果,其中文能力尤為出色,在中文科技、金融、政務(wù)等領(lǐng)域表現(xiàn)均高于其他開源模型。
除模型開源外,Skywork-13B系列大模型還將開源600GB、150B Tokens的高質(zhì)量中文語料數(shù)據(jù)集Skypile/Chinese-Web-Text-150B,這是目前最大的開源中文數(shù)據(jù)集之一。同時,昆侖萬維天工Skywork-13B系列大模型即將全面開放商用,即開發(fā)者無需申請即可商用。
開源生態(tài)建設(shè)是AI技術(shù)和應(yīng)用融合的重要一環(huán),可以降低模型的研發(fā)門檻和使用成本,最大化共享技術(shù)能力和經(jīng)驗(yàn),讓更多企業(yè)和開發(fā)者參與到AI變革中。
今年4月,昆侖萬維發(fā)布了大語言模型天工3.5,并啟動邀請測試。8月,昆侖萬維發(fā)布國內(nèi)第一款A(yù)I搜索產(chǎn)品——天工AI搜索。9月,昆侖萬維正式控股艾捷科芯,布局AI芯片。