国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
中文最強(qiáng)開(kāi)源大模型來(lái)了!130億參數(shù),0門檻商用,來(lái)自昆侖萬(wàn)維
金磊 明敏 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

開(kāi)源最徹底的大模型來(lái)了——130億參數(shù),無(wú)需申請(qǐng)即可商用。

不僅如此,它還附帶著把全球最大之一的中文數(shù)據(jù)集也一并開(kāi)源了出來(lái):600G、1500億tokens!

這就是來(lái)自昆侖萬(wàn)維的Skywork-13B系列,包含兩大版本:

  • Skywork-13B-Base:該系列的基礎(chǔ)模型,在多種基準(zhǔn)評(píng)測(cè)中都拔得頭籌的那種。

  • Skywork-13B-Math:該系列的數(shù)學(xué)模型,數(shù)學(xué)能力在GSM8K評(píng)測(cè)上得分第一。

在各大權(quán)威評(píng)測(cè)benchmark上,如C-Eval、MMLU、CMMLU、GSM8K,可以看到Skywork-13B在中文開(kāi)源模型中處于前列,在同等參數(shù)規(guī)模下為最優(yōu)水平。

而Skywork-13B系列之所以能取得如此亮眼的成績(jī),部分原因離不開(kāi)剛才我們提到的數(shù)據(jù)集。

畢竟清洗好的中文數(shù)據(jù)對(duì)于大模型來(lái)說(shuō)可謂是至關(guān)重要,幾乎從某種程度上決定了其性能。

但昆侖萬(wàn)維能將如此“至寶”無(wú)償?shù)亟o奉獻(xiàn)出來(lái),不難看出它對(duì)于構(gòu)建開(kāi)源社區(qū)、服務(wù)開(kāi)發(fā)者的慢慢誠(chéng)意。

除此之外,昆侖萬(wàn)維Skywork-13B此次還配套了“輕量版”大模型,是在消費(fèi)級(jí)顯卡中就能部署和推理的那種!

Skywork-13B下載地址(Model Scope):
https://modelscope.cn/organization/skywork

Skywork-13B下載地址(Github):
https://github.com/SkyworkAI/Skywork

接下來(lái),我們進(jìn)一步來(lái)看下Skywork-13B系列更多的能力。

無(wú)需申請(qǐng)即可商用

Skywork-13B系列大模型擁有130億參數(shù)、3.2萬(wàn)億高質(zhì)量多語(yǔ)言訓(xùn)練數(shù)據(jù)。

由此,模型在生成、創(chuàng)作、數(shù)學(xué)推理等任務(wù)上提升明顯。

首先在中文語(yǔ)言建模困惑度評(píng)測(cè)中,Skywork-13B系列大模型超越了目前所有中文開(kāi)源模型。

在科技、金融、政務(wù)、企業(yè)服務(wù)、文創(chuàng)、游戲等領(lǐng)域均表現(xiàn)出色。

另外,Skywork-13B-Math專長(zhǎng)數(shù)學(xué)任務(wù),進(jìn)行過(guò)數(shù)學(xué)能力強(qiáng)化訓(xùn)練,在GSM8K等數(shù)據(jù)集中取得了同等規(guī)模模型最佳效果。

與此同時(shí),昆侖萬(wàn)維還開(kāi)源了數(shù)據(jù)集Skypile/Chinese-Web-Text-150B。其數(shù)據(jù)是通過(guò)精心過(guò)濾的數(shù)據(jù)處理流程從中文網(wǎng)頁(yè)中篩選而來(lái)。

由此,開(kāi)發(fā)者可以最大程度借鑒技術(shù)報(bào)告中大模型預(yù)訓(xùn)練的過(guò)程和經(jīng)驗(yàn),深度定制模型參數(shù),進(jìn)行針對(duì)性訓(xùn)練與優(yōu)化 。

除此之外,Skywork-13B還公開(kāi)了模型使用的評(píng)估方法、數(shù)據(jù)配比研究和訓(xùn)練基礎(chǔ)設(shè)施調(diào)優(yōu)方案等。

而Skywork-13B的一系列開(kāi)源,無(wú)需申請(qǐng)即可商用!

用戶在下載模型并同意遵守《Skywork模型社區(qū)許可協(xié)議》后,不用再次申請(qǐng)商業(yè)授權(quán)。

授權(quán)流程也取消了對(duì)行業(yè)、公司規(guī)模、用戶數(shù)量等方面限制。

昆侖萬(wàn)維會(huì)如此徹底開(kāi)源其實(shí)也并不意外。

昆侖萬(wàn)維董事長(zhǎng)兼CEO方漢是最早參與到開(kāi)源生態(tài)建設(shè)的老兵了,也是中文Linux開(kāi)源最早的推動(dòng)者之一。

在今年ChatGPT趨勢(shì)剛剛興起時(shí),他就多次公開(kāi)發(fā)聲、強(qiáng)調(diào)開(kāi)源的重要性:

代碼開(kāi)源可助力中國(guó)版ChatGPT彎道超車。

所以也就不難理解Skywork-13B系列大模型的推出了。

所以,Skywork-13B系列開(kāi)源工作,具體是如何實(shí)現(xiàn)的呢?

更“瘦”結(jié)構(gòu)、更全數(shù)據(jù)

Skywork-13B的技術(shù)細(xì)節(jié)可以從四方面看起:

  • 模型結(jié)構(gòu)

  • 訓(xùn)練數(shù)據(jù)

  • 訓(xùn)練方法

  • 評(píng)估方法

首先在結(jié)構(gòu)上,Skywork-13B相比Llama2-13B,更加“瘦長(zhǎng)”,模型層數(shù)為52。

這樣做的好處是能在大Batch Size訓(xùn)練下取得更好泛化效果。

同時(shí)將FFN Dim縮小到12288和4608,可以保證模型參數(shù)量和原始Llama2-13B模型相當(dāng)。

具體Skywork-13B和Llama2-13B對(duì)比如下:

其次在數(shù)據(jù)方面,昆侖萬(wàn)維也公開(kāi)了英文、中文、代碼數(shù)據(jù)的比例。

可以看到中英文部分吸收了大量網(wǎng)頁(yè)數(shù)據(jù)和社交媒體數(shù)據(jù),同時(shí)兼顧了相對(duì)專業(yè)的方面,比如學(xué)術(shù)論文、年報(bào)、文書(shū)等。

代碼方面則主要從GitHub上吸收數(shù)據(jù)。

在訓(xùn)練方法方面,Skywork-13B也是完全開(kāi)源。

訓(xùn)練共有兩個(gè)階段:

第一階段使用通用語(yǔ)料進(jìn)行通用能力學(xué)習(xí),第二部分加入STEM(科學(xué),技術(shù),工程,數(shù)學(xué))相關(guān)數(shù)據(jù)進(jìn)一步增強(qiáng)模型的推理能力、數(shù)學(xué)能力、問(wèn)題解決能力。

這樣做的好處是能更加精細(xì)化利用數(shù)據(jù)。

最后在模型評(píng)估方面,昆侖萬(wàn)維給出了領(lǐng)域數(shù)據(jù)困惑度評(píng)估方法。

大語(yǔ)言模型訓(xùn)練的本質(zhì)是讓預(yù)測(cè)的下一個(gè)詞(個(gè)體)更加準(zhǔn)確。

昆侖萬(wàn)維認(rèn)為評(píng)估基礎(chǔ)大模型的一個(gè)重要方式,就是評(píng)估在各個(gè)領(lǐng)域中,大語(yǔ)言模型生成文章(整體)的概率。

一般模型預(yù)測(cè)下一個(gè)詞的概率會(huì)使用Cross Entropy損失函數(shù),整體的損失函數(shù)為每個(gè)位置預(yù)測(cè)真實(shí)詞損失的平均:

n表示文檔長(zhǎng)度(token數(shù)量),pi是位置i上真實(shí)詞的概率。

將文檔中每個(gè)位置上真實(shí)詞的概率連乘,則為生成文檔整體的概率。

這樣一來(lái),就能將loss和生成文章的概率聯(lián)系在一起了。

而由于不同模型使用的分詞器不同,token數(shù)量不同,因此對(duì)損失函數(shù)乘以token數(shù)目n,這樣就能僅考慮生成文章的概率部分,不同模型也可以進(jìn)行比較。

將標(biāo)準(zhǔn)化后loss取指數(shù)轉(zhuǎn)換成perplexity(困惑),可以使模型的差異更加可讀。

基于如上分析,昆侖萬(wàn)維在多個(gè)領(lǐng)域篩選出了這個(gè)月發(fā)表的成百上千篇高質(zhì)量文章(2023年10月),并進(jìn)行人工核對(duì)。

選擇最新的數(shù)據(jù),為的是保證測(cè)試數(shù)據(jù)不在所有評(píng)估大模型的訓(xùn)練集范圍內(nèi)。

如下是最后評(píng)估結(jié)果,可以看到Skywork-13B表現(xiàn)突出。

如何評(píng)價(jià)?

對(duì)于昆侖萬(wàn)維此次的開(kāi)源發(fā)布,可以說(shuō)它主打的就是個(gè)“敢”。

畢竟能將大模型背后的利器——高質(zhì)量數(shù)據(jù)集,能夠如此毫不避諱地放出來(lái)共享,放眼全球范圍都是寥寥無(wú)幾的存在。

而若是將時(shí)間線拉開(kāi)來(lái)看,我們就不難理解昆侖萬(wàn)維是怎么這么“敢”的了。

早在今年年初、全球各大廠商大模型“爭(zhēng)奇斗艷”白熱化階段,昆侖萬(wàn)維就以黑馬的姿態(tài)直接殺入百模大戰(zhàn)。

首發(fā)就敢以現(xiàn)場(chǎng)直播、實(shí)時(shí)演示的方式,讓天工參加自家程序員面試,并且很流暢地通過(guò)了第一關(guān):

而且除了面試題之外,昆侖萬(wàn)維還敢直面彈幕中網(wǎng)友們現(xiàn)場(chǎng)提出的各種刁鉆問(wèn)題:

在接下來(lái)的時(shí)間里,昆侖萬(wàn)維還保持著數(shù)月一迭代的優(yōu)化,讓語(yǔ)義理解、推理等任務(wù)變得更加絲滑。

并且在8月底,昆侖萬(wàn)維率先在國(guó)內(nèi)推出了第一款融入大模型能力的AI搜索。

是當(dāng)時(shí)刨除插件形式之外,第一個(gè)敢將大模型能力投入應(yīng)用的獨(dú)立AI搜索產(chǎn)品。

而在短短2個(gè)月后,昆侖萬(wàn)維又將最新的大模型、最新的數(shù)據(jù)集,一并發(fā)布且開(kāi)源,可以說(shuō)它的一切動(dòng)作不僅在于快,更是在于敢。

那么接下來(lái)的問(wèn)題是——為什么要這么做?

其實(shí),對(duì)于AIGC這一板塊,昆侖萬(wàn)維早在2020年便已經(jīng)開(kāi)始涉足,早早的準(zhǔn)備和技術(shù)積累就是它能夠在大熱潮來(lái)臨之際快速跟進(jìn)的原因之一。

據(jù)了解,昆侖萬(wàn)維目前已形成AI大模型、AI搜索、AI游戲、AI音樂(lè)、AI動(dòng)漫、AI社交六大AI業(yè)務(wù)矩陣。

至于不遺余力的將開(kāi)源這事做好做大,一方面是源于企業(yè)的基因。

昆侖萬(wàn)維董事長(zhǎng)兼CEO方漢是最早參與到開(kāi)源生態(tài)建設(shè)的開(kāi)源老兵,也是中文Linux開(kāi)源最早的推動(dòng)者之一,開(kāi)源的精神和AIGC技術(shù)的發(fā)展早已在昆侖萬(wàn)維戰(zhàn)略中完美融合。

正如方漢此前所言:

昆侖天工之所以選擇開(kāi)源,因?yàn)槲覀儓?jiān)信開(kāi)源是推動(dòng)AIGC生態(tài)發(fā)展的土壤和重要力量。昆侖萬(wàn)維致力于在AIGC模型算法方面的技術(shù)創(chuàng)新和開(kāi)拓,致力于推進(jìn)開(kāi)源AIGC算法和模型社區(qū)的發(fā)展壯大,致力于降低AIGC技術(shù)在各行各業(yè)的使用和學(xué)習(xí)門檻。

沒(méi)錯(cuò),降低門檻,便是其堅(jiān)持開(kāi)源的另一大原因。

從昆侖萬(wàn)維入局百模大戰(zhàn)以來(lái)的種種動(dòng)作中,也很容易看到它正在踐行著讓天工用起來(lái)更簡(jiǎn)單、更絲滑。

總而言之,昆侖萬(wàn)維目前已然是處于國(guó)產(chǎn)大模型的第一梯隊(duì),甚至說(shuō)是立于金字塔尖都不足為過(guò)。

那么在更大力度的開(kāi)源加持之下,天工大模型還將有怎樣驚艷的表現(xiàn),是值得期待一波了。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開(kāi)APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
性能全面超越LLaMA2,0門檻商用,這個(gè)國(guó)產(chǎn)大模型要改變開(kāi)源競(jìng)爭(zhēng)格局了
2022,AIGC元年?
華泰 | 計(jì)算機(jī): ChatGPT深度拆解
AI大模型的白堊紀(jì)
類ChatGPT新玩家「商量」入場(chǎng),商湯如何「日日新」?
出門問(wèn)問(wèn)把AIGC看得很透徹
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服