后入旗袍美女视频,街拍牛仔裤美女视频,美女视频在线看网址

最強開源編程大模型一夜易主：精通80 語言，僅22B

黃爸爸好 >《模型》

2024.06.03 上海

關注

克雷西發(fā)自凹非寺
量子位 | 公眾號 QbitAI

開源代碼大模型的王座，再次易主！

來自素有“歐洲OpenAI”之稱的Mistral，用22B參數(shù)量表現(xiàn)超越了70B的Code Llama。

模型名為Codestral，將代碼的英文Code與公司名結(jié)合而成。

在80多種編程語言上進行過訓練后，Codestral用更少的參數(shù)實現(xiàn)了更高的性能，窗口長度也達到了32k，相比之前一眾4k、8k的模型大幅增加。

而且已經(jīng)有人表示，GPT-4o和Claude3-Opus都失敗的代碼編輯任務，被Codestral成功解決了。

于是有網(wǎng)友直言，Codestral的推出，直接改寫了多語言代碼模型的游戲規(guī)則。

另一方面，還有網(wǎng)友直接@了知名本地大模型框架Ollama，希望能夠支持Codestral，結(jié)果Ollama這邊也迅速響應，在請求發(fā)出后1個小時就增加了對Codestral的支持。

那么，Codestral在測試中都取得了哪些成績呢？

開源編程模型的新王者

Codestral的參數(shù)量為22B，支持32k的上下文窗口。

在開發(fā)過程中，研究人員使用了80多種編程語言的代碼數(shù)據(jù)對Codestral進行了訓練。

其中既包括Python、Java、C++和Bash等這些流行語言，也有像Fortran、COBOL這樣的古早語言。

值得一提的是，其中的COBOL誕生于1959年，但至今全球仍有43%的銀行系統(tǒng)依賴它，然而另一方面，現(xiàn)在會用的人數(shù)卻寥寥無幾，而且普遍年事已高。

AI工具對COBOL的支持，或許將成為解決COBOL人才極度緊缺問題的一種途徑。

說回到Codestral，雖然參數(shù)量只有不到三分之一，但測評成績已經(jīng)大幅超過了70B的Code Llama。

對于Python語言，研發(fā)團隊使用了HumanEval（pass@1）和MBPP評估了Codestral的Python代碼生成能力，用CruxEval來評估輸出預測，以及用RepoBench評估Codestral在遠程存儲庫中的代碼補全能力。

結(jié)果，Codestral在其中的三項測試中都取得了最佳成績，并對Llama 3和Code Llama形成了全面超越。

數(shù)據(jù)庫方面，在針對SQL的Spider測試中，Codestral的表現(xiàn)也與通用模型Llama3十分接近。

對于其他一些編程語言，Codestral和通用版Llama3各有勝負，平均成績則小幅超過了Llama3，但相對于Code Llama的優(yōu)勢是十分明顯的。

另外，Codestral還支持FIM（fill-in-the-middle），也就是可以對現(xiàn)有代碼進行填充補全。

在Python、JS和Java三種語言當中，Codestral都取得了接近或超過90%的HumanEvalFIM評分，平均成績91.6%，超過了參數(shù)量更大的DeepSeek Coder 33B。

速度方面，使用在線對話版本，只要三秒鐘就能構(gòu)建出一個帶有頂部banner和側(cè)邊欄的HTML框架。

不僅性能表現(xiàn)優(yōu)異，形式上，Codestral支持的使用方式也多種多樣。

Mistral已經(jīng)把模型權重上傳到了HuggingFace，有條件的可以自行下載部署。

以及LangChain、LlamaIndex，還有開頭提到的Ollama等這些大模型框架，以及Mistral自家的開發(fā)者平臺La Plateforme當中都已經(jīng)支持使用Codestral。

專屬API也正在趕來的路上，正在進行為期8周的測試，期間開發(fā)者可以免費使用。

如果還是不會部署的話，也可以到Mistral的在線對話平臺Le Chat當中，直接使用網(wǎng)頁進行對話。

當然，開發(fā)者更關心的，可能還是能不能集成到IDE中使用。

對此，官方暫未推出原生的IDE支持，不過已經(jīng)有Continue.dev、Tabnine等第三方插件支持了Codestral，可以通過這些插件在VSCode和JetBrains系列IDE中使用。

One More Thing

與Codestral一同官宣的，還有Mistral全新的“非生產(chǎn)”（Non-Production）許可協(xié)議，簡稱MNPL。

本次發(fā)布的CodeStral使用的許可協(xié)議也正是MNPL，按照規(guī)定僅可用于研究目的，不能進行商用。

并且，這份協(xié)議對“非商用”的界定也十分嚴格，即使僅將其用于公司內(nèi)部事務也不被允許。

有開源作者就此吐槽，他們用我代碼的時候從未征求我的意見，為什么還反過來要求我遵守他們的規(guī)定，這實在是太荒謬了。

而Mistral這邊的解釋則是，如果放開商業(yè)用途，可能無法得到使用者對模型研發(fā)的貢獻。

官方同時也表示，雖然Codestral不能商用，但并不意味著之后的其他開源模型也是如此，同時明確表示后續(xù)會繼續(xù)發(fā)布基于Apache 2.0協(xié)議的其他模型。

參考鏈接：
[1]https://mistral.ai/news/codestral/
[2]https://x.com/GuillaumeLample/status/1795820710750744839
[3]https://www.theverge.com/2024/5/29/24166334/mistral-debuts-a-coding-assistant-called-codestral

— 完 —

本站僅提供存儲服務，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權內(nèi)容，請點擊舉報。

打開APP，閱讀全文并永久保存查看更多類似文章

速度秒掉GPT-4o、22B擊敗Llama 3 70B，Mistral AI開放首個代碼模型

人工智能[1233]當大模型公司都在卷大參數(shù)，面壁智能卻在盡可能把參數(shù)做小

開源大模型超越GPT-3.5！爆火MoE實測結(jié)果出爐，網(wǎng)友：OpenAI越來越?jīng)]護城河了

一行命令，本地、離線運行大模型

新火種AI|OpenAI核心資料被盜！谷歌承認“主動攻擊”，成本僅150元？

微軟又投了一家大模型公司！“法國版OpenAI”剛剛發(fā)布新模型，對標GPT-4

更多類似文章 >>

国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

克雷西 發(fā)自 凹非寺量子位 | 公眾號 QbitAI

開源編程模型的新王者

One More Thing

克雷西發(fā)自凹非寺
量子位 | 公眾號 QbitAI