国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
用AI做考研數(shù)學(xué)一,我得了136分
技術(shù)進(jìn)步,特別是AI,已經(jīng)在很多領(lǐng)域帶來了革命性的變化?,F(xiàn)在有很多人對(duì)于大模型的應(yīng)用還存在有一定的排斥,尤其在日常的大學(xué)數(shù)學(xué)學(xué)習(xí)與教學(xué)中,認(rèn)為大模型的出現(xiàn)不利于學(xué)生更扎實(shí)、認(rèn)真地的學(xué)習(xí)。其實(shí),任何技術(shù)的出現(xiàn)都有其雙面性,在大學(xué)數(shù)學(xué)基礎(chǔ)課的學(xué)習(xí)過程中,我們認(rèn)為,好的大模型對(duì)于咱們更好地理解問題,打牢基礎(chǔ),解題能力和學(xué)習(xí)效率的提升還是具有很大作用的,尤其能夠彌補(bǔ)像高等數(shù)學(xué)、線性代數(shù)、概率論與數(shù)理統(tǒng)計(jì)這樣的大班教學(xué)與學(xué)習(xí)環(huán)節(jié)中的實(shí)時(shí)反饋的不足,針對(duì)學(xué)生日常遇到的基礎(chǔ)、常規(guī)性的問題能夠提供及時(shí)的互動(dòng)。
當(dāng)前國(guó)產(chǎn)大模型的大學(xué)數(shù)學(xué)基礎(chǔ)課程的解題能力究竟如何,它們又能怎樣促進(jìn)我們解題能力的提升,及時(shí)幫助我們解決學(xué)習(xí)中遇到的問題呢?我們借助2025年考研數(shù)學(xué)一試卷(相對(duì)來說考研數(shù)學(xué)一、二、三中,應(yīng)該數(shù)學(xué)一最難,覆蓋內(nèi)容最廣),一起來測(cè)試一下當(dāng)前具有代表性的四家國(guó)產(chǎn)大模型,看看它們的真實(shí)智商水平到底如何。我們選擇的四家大模型及版本如下(都選擇電腦網(wǎng)頁(yè)版):
  • Kimi:點(diǎn)選新推出的Kimi k1 視覺思考版,如下圖,打開網(wǎng)站后點(diǎn)擊下面的“Kimi k1 視覺思考模型搶先體驗(yàn)”,進(jìn)入最新的思考模型版本。網(wǎng)址:
https://kimi.moonshot.cn
  • DeepSeek:打開“深度思考”,如下圖,打開網(wǎng)站后點(diǎn)擊下面的“深度思考”開關(guān),使其從黑色變?yōu)樗{(lán)色即為打開狀態(tài)。網(wǎng)址:
https://chat.deepseek.com
  • 字節(jié)豆包:處理方式?jīng)]有選擇,選用默認(rèn)模式??梢栽诓僮鲿r(shí)點(diǎn)擊列出的“解題答疑”,如下圖,也可以不選擇直接輸入。網(wǎng)址
https://www.doubao.com/chat
  • 文心一言:非會(huì)員默認(rèn)為文心大模型3.5,為了測(cè)試的公正性,咱們選擇了會(huì)員版的最高級(jí)版本:文心大模型4.0 Turbo.  同樣輸入會(huì)話框沒有選擇,采用默認(rèn)模式。網(wǎng)址:
https://yiyan.baidu.com
2025年考研數(shù)學(xué)一試卷的測(cè)試題目來源于公眾號(hào):考研競(jìng)賽數(shù)學(xué) 排版推送的推文,在以圖片方式輸入時(shí)使用的是帶有水印的圖片,答案也對(duì)照推文中的答案(點(diǎn)擊查看).  
那么,這些大模型在解題過程中給出的步驟究竟如何,能夠給與我們?cè)鯓拥慕忸}、學(xué)習(xí),答疑解惑的提示呢?哪個(gè)模型給出的解題思路更完整、更規(guī)范,哪個(gè)的參考性與實(shí)用性最大呢?我們分兩種方式一起來測(cè)試一下。
批量問題求解風(fēng)格對(duì)比
首先,我們將所有選擇題集中到一張圖片來測(cè)試四個(gè)大模型的圖片識(shí)別與批量解題能力,提示詞統(tǒng)一為:給出這10個(gè)選擇題的求解過程與正確選項(xiàng)。上傳的圖片如下:
測(cè)試過程中對(duì)于結(jié)果對(duì)的直接給5分;對(duì)于得到了可以直接判定結(jié)果的表達(dá)式,而選項(xiàng)錯(cuò)誤的題目給2.5分,過程沒有直接可以得到結(jié)果的表達(dá)式和答案都錯(cuò)的給0分。最終四個(gè)模型分?jǐn)?shù)(總分50分)及對(duì)比分析如下:

  • Kimi視覺思考版(37.5)
    兩次測(cè)試綜合得分37.5分,Kimi最大的優(yōu)勢(shì)是針對(duì)每個(gè)題目都提供了詳細(xì)的探索過程,批量圖片識(shí)別和解題能力還是比較完美和值得肯定的。尤其是每個(gè)題目都給出了必要的分析、求解過程,既使沒有做對(duì),也可以給與我們解題過程一定的啟示。如下圖。

  • DeepSeek深度思考模型(15分)
    不管是深度思考過程和解答過程都非常簡(jiǎn)單,沒有必要的求解步驟和過程,最終得分也不是很理想,得分僅僅15分。

  • 豆包(10分)
    求解過程相對(duì)于DeepSeek有所完善,但是正確率不高,綜合得分10分。

  • 文心一言
    對(duì)于這樣批量輸入一次求解基本上沒法執(zhí)行,每個(gè)題目都沒有明確的結(jié)果,給出的說明、提示也模棱兩可,完全需要用戶重新思考與探索。

對(duì)于批量題目圖片上傳測(cè)試結(jié)果來看,Kimi視覺思考版結(jié)果相對(duì)來說還是比較滿意的,對(duì)比而言優(yōu)勢(shì)比較明顯。那么,對(duì)于單個(gè)題目它們的表現(xiàn)如何呢,我們也一起來測(cè)試對(duì)比一下。
單個(gè)題目求解分?jǐn)?shù)對(duì)比
測(cè)試說明:為了真實(shí)測(cè)試四個(gè)大模型的真實(shí)數(shù)學(xué)解題能力,我們以完整題目的Latex文本格式,或者單個(gè)題目圖片上傳的方式逐題進(jìn)行測(cè)試,對(duì)于四個(gè)大模型采取了兩次測(cè)試的方式獲取分?jǐn)?shù),如果第一次就測(cè)試正確,則不使用第二次;如果第一次不正確,則重新做一遍,兩次不對(duì)就不再測(cè)試。對(duì)于簡(jiǎn)答題,根據(jù)解答過程給出了步驟分,而對(duì)于19題的證明題,導(dǎo)數(shù)單調(diào)證明不等式成立的過程都比較嚴(yán)謹(jǐn),第二步的證明大體都差不多,所以統(tǒng)一給出了6分。最終分?jǐn)?shù)對(duì)比如下:
最終的測(cè)試結(jié)果來看,本次考研數(shù)學(xué)初試數(shù)學(xué)成績(jī),Kimi視覺思考模型、DeepSeek深度思考模型達(dá)到了不可思議的130分以上,豆包92分也及格了,文心一言82分也接近及格。
我記得今年年初的時(shí)候,感覺一些大模型做數(shù)學(xué)題還完全不盡人意,經(jīng)常答非所問,沒想到到了今年年底,卻有如此進(jìn)步,確實(shí)難得!
對(duì)于單個(gè)題目的求解風(fēng)格,我們?cè)谶x擇題(概率論與數(shù)理統(tǒng)計(jì)題)、填空題(線性代數(shù)題)、解答題(高等數(shù)學(xué)題)中各選題目的解答過程對(duì)比一起來分析一下。

單個(gè)題模型解題風(fēng)格對(duì)比

1、選擇題測(cè)試選擇題第8題

Kimi視覺思考版解答過程:
DeepSeek深度思考模型解答過程
豆包解答過程
文心一言解答過程
測(cè)試結(jié)果點(diǎn)評(píng)對(duì)于概率論與數(shù)理統(tǒng)計(jì)的考研題,四個(gè)模型解答過程、結(jié)果都不錯(cuò),而且都是一次答對(duì)!這也反映出歷屆考研試題中出現(xiàn)的概率統(tǒng)計(jì)題應(yīng)該普遍都是比較經(jīng)典的問題,題型、解題方法比較固定!具體表現(xiàn)如下:
  • Kimi解答過程規(guī)范,過程詳盡,可閱讀性強(qiáng),比較符合咱們的自己常見的求解思路與過程。有些求解過程有明確的解題步驟提示,思路過程分析,具有自我糾錯(cuò)和結(jié)果驗(yàn)證過程,對(duì)于我們?nèi)粘=忸}訓(xùn)練具有比較好的指導(dǎo)意義和參考價(jià)值。
  • DeepSeek:最終給出的過程簡(jiǎn)明扼要,不足的是最終的結(jié)果顯示為一個(gè)代碼。而其深度思考、分析過程則非常詳盡,并且給出了結(jié)果的檢驗(yàn)過程和各種情況的討論,對(duì)于其中涉及到的知識(shí)點(diǎn)、方法有一定的啟示意義。最終給出的過程選擇的最值確定方法和Kimi思路一致??砷喿x性需要進(jìn)一步加強(qiáng),尤其是最終結(jié)果的顯示一般為L(zhǎng)atex文本。
  • 豆包:豆包給出的過程步驟明確,并且附帶了相關(guān)知識(shí)點(diǎn)、公式的回顧,然后代入公式計(jì)算得到結(jié)果,其最值的確定則選用了均值不等式,簡(jiǎn)明扼要,也不缺少必要的步驟。
  • 文心一言:步驟過程簡(jiǎn)明扼要,只是排版不是很規(guī)范,選用的最值確定方法與豆包相同。

2、填空題測(cè)試填空題第11題

Kimi視覺思考版解答過程:
DeepSeek深度思考模型解答過程
豆包解答過程
文心一言解答過程
測(cè)試結(jié)果點(diǎn)評(píng):對(duì)于線性代數(shù)的考研題,可能這個(gè)題目原因,條件理解的復(fù)雜性,模型對(duì)問題的理解不是很到位,雖然三個(gè)模型做對(duì),但是解答過程不是很符合題目的條件,也不完全符合填空題的求解思路。
  • Kimi:題目意思理解不完全正確。但是給出的討論步驟卻還可以。行列式的計(jì)算采用降階法,利用行列式等于0得到了結(jié)果。不過后面又多了很多冗余的步驟,當(dāng)然,自己也說明了自己的討論可能沒有必要!最后進(jìn)一步明確了結(jié)果,總體來說,還不錯(cuò)!
  • DeepSeek:深度思考和最終給出的過程比Kimi相對(duì)簡(jiǎn)明扼要,當(dāng)然也出現(xiàn)了多余的討論步驟,同樣的不足的是最終的結(jié)果顯示為一個(gè)代碼。其求解分析步驟和Kimi差不多,不過Kimi降階法的過程更詳細(xì),對(duì)于我們理解這一方法更有實(shí)際意義。
  • 豆包:對(duì)于這個(gè)題目的表現(xiàn)應(yīng)該來說還不錯(cuò),其給出的過程有助于我們進(jìn)一步了解兩個(gè)方程組的解的關(guān)系的判定。行列式的計(jì)算同樣選擇了降階法,并且給出了詳細(xì)步驟,它的第2步完全可以作為這個(gè)題目的求解過程使用。
  • 文心一言:彎彎繞繞分析一大堆,最終沒有給出需要的結(jié)果,對(duì)于這個(gè)題目的求解應(yīng)該來說完全失敗,而且分析過程也不完整,讓人總感覺意猶未盡!而且兩次測(cè)試都做錯(cuò),并且得到的結(jié)果都是負(fù)1.
3、簡(jiǎn)答題測(cè)試
簡(jiǎn)答題第17題:
Kimi視覺思考版解答過程:
DeepSeek深度思考模型解答過程
豆包解答過程
文心一言解答過程
測(cè)試結(jié)果點(diǎn)評(píng):對(duì)于這個(gè)高等數(shù)學(xué)的考研題,應(yīng)該是非常經(jīng)典的問題,有理函數(shù)的定積分??傮w來說前三個(gè)模型表現(xiàn)不錯(cuò),給出正確求解過程對(duì)于這類問題的求解具有參考借鑒意義!
  • Kimi過程規(guī)范,完全可以作為這個(gè)題目的標(biāo)準(zhǔn)解答過程!
  • DeepSeek:過程相對(duì)規(guī)范,不過給出的最終解答過程沒有Kimi詳細(xì),對(duì)于有一定基礎(chǔ)的同學(xué)能夠直接理解其各中間過程,其思路方法、包括深度思考分析也和Kimi差不多。
  • 豆包:同樣對(duì)于這個(gè)題目的表現(xiàn)應(yīng)該來說還不錯(cuò),其給出的過程雖然稍顯啰嗦,但是對(duì)于對(duì)于相關(guān)步驟的理解具有一定的參考意義!
  • 文心一言:最大的失誤竟然是部分分式分解錯(cuò)誤. 如果這個(gè)部分不錯(cuò),后面的積分過程還是一個(gè)有效過程,個(gè)人認(rèn)為這是一個(gè)不應(yīng)該出現(xiàn)的錯(cuò)誤,畢竟屬于初等數(shù)學(xué)的內(nèi)容!而且兩次測(cè)試都出錯(cuò)了!
對(duì)于四個(gè)模型,Kimi和DeepSeek對(duì)于解題相對(duì)來說過程一般就題論題,解答過程比較專業(yè)、嚴(yán)謹(jǐn),正確率比較高!測(cè)試過程中表現(xiàn)出來的解題思路,兩個(gè)模型的相似度比較大!而豆包與文心一言的解題過程與步驟則有類似的地方,不過豆包相對(duì)來說比文心一言表現(xiàn)要好!它們兩個(gè)最大的一個(gè)不同就是,在題目的最后給出了與當(dāng)前問題密切相關(guān)的知識(shí)點(diǎn)、方法擴(kuò)展性內(nèi)容提示。
比如點(diǎn)擊豆包后面的“常用的積分方法有哪些?”,系統(tǒng)會(huì)給出一些常用的計(jì)算方法的基本原理適用的情況,如下圖。
這些總結(jié)性的內(nèi)容對(duì)于我們加強(qiáng)相關(guān)知識(shí)點(diǎn)的復(fù)習(xí)很有參考價(jià)值,而且還會(huì)繼續(xù)給出相關(guān)內(nèi)容的提示與引導(dǎo),從而在層層推進(jìn)中更加系統(tǒng)化深入理解某些專題內(nèi)容。
在測(cè)試過程中還發(fā)現(xiàn)一個(gè)有意思的過程:Kimi的多次驗(yàn)證確保正確的過程分析
這樣的過程不是針對(duì)于每個(gè)題目都會(huì)出現(xiàn),而且每次測(cè)試的時(shí)候返回的結(jié)果與過程也不一樣!不過對(duì)于這個(gè)題目一般都可以得到正確的結(jié)果!這樣的分析過程對(duì)于相關(guān)問題的求解思路方法的理解,使用過程中要注意的事項(xiàng)都提供了一個(gè)比較好的分析!
同樣過程也出現(xiàn)在DeepSeek的深度思考過程中,并且通過對(duì)比分析最終選擇一個(gè)相對(duì)有效的過程給出解答過程!而這樣的過程在豆包和文心一言中不會(huì)出現(xiàn),一般都是相對(duì)比較直接的得到結(jié)果。

總  結(jié)

通過全套試卷的測(cè)試對(duì)比,可以看到:
  • Kimi視覺思考版和DeepSeek的深度思考模型:在批量題目的解答上,Kimi的優(yōu)勢(shì)非常明顯,解答過程也更規(guī)范,排版效果非常直觀,對(duì)于有些題目的執(zhí)行過程還有自我糾錯(cuò)、結(jié)果驗(yàn)算的過程;而DeepSeek的深度思考過程,也給出解答過程的思路分析和探索過程,最終給出的答案是經(jīng)過多重遴選的結(jié)果。

    總的來說,Kimi的思路探索、解題步驟,尤其是對(duì)圖片的識(shí)別表現(xiàn)非常出色,136分的表現(xiàn)令人驚喜

  • 豆包和文心一言:豆包相對(duì)來說表現(xiàn)比較穩(wěn)定,給出的推導(dǎo)步驟相對(duì)來說比較簡(jiǎn)潔,正確率還是有一定的保證。同時(shí),對(duì)于有些問題的求解條理非常清晰,過程步驟比較明顯,很多時(shí)候還給出了知識(shí)點(diǎn)提示。相對(duì)來說,文心一言可能側(cè)重點(diǎn)不同,對(duì)于一些非常常規(guī)的問題能夠給出簡(jiǎn)要解答過程和正確結(jié)果,但是對(duì)于一些簡(jiǎn)單問題也不能完成基本的計(jì)算,另外不同的一點(diǎn)是,不像Kimi和DeepSeek,在做不出來的時(shí)候,它們會(huì)進(jìn)行各種嘗試,可以說會(huì)窮舉很多與問題相關(guān)的方法,盡一切可能來探索問題的求解思路,而文心一言則僅僅給出文字思路提示,告訴我們它做不下去了!

    不過豆包和文心一言比較的好的地方是,它們?cè)诮獯鹬髸?huì)給出進(jìn)一步探討的三個(gè)提示詞鏈接,點(diǎn)擊可以進(jìn)一步了解與問題相關(guān)的知識(shí)點(diǎn)、方法,有助于咱們進(jìn)一步加強(qiáng)與提交問題相關(guān)的內(nèi)容的理解與系統(tǒng)化學(xué)習(xí)。

以上是咱號(hào)對(duì)于四個(gè)大模型的比較分析,其中優(yōu)劣應(yīng)該從以上的測(cè)試結(jié)果和對(duì)比分析中應(yīng)該有所認(rèn)識(shí),實(shí)際效果需要學(xué)友們進(jìn)一步自行檢測(cè),畢竟每次提交可能結(jié)果都可能不相同,有時(shí)候還會(huì)差別比較大!以上測(cè)試過程除了文心一言使用的是會(huì)員版的模型外,其他模型只要注冊(cè)就可以免費(fèi)使用,至少在測(cè)試過程中貌似沒有任何限制。
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
Kimi的數(shù)學(xué)模型來了,這次甚至能挑戰(zhàn)高考
豆包揭示了字節(jié)未來布局的野心,12家大模型公司的未來發(fā)展分化已有征兆
幻方大模型概念股梳理
AI寫作|國(guó)產(chǎn)最強(qiáng)AI寫作大模型,不是KimiChat(內(nèi)附指令)
火山引擎“奇襲”阿里云
大模型“價(jià)格戰(zhàn)”爆發(fā),誰能搶占商業(yè)化制高點(diǎn)?|價(jià)格戰(zhàn)
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服