美女视频下面,韩国美女黑色蕾丝热舞视频

技術(shù)進(jìn)步，特別是AI，已經(jīng)在很多領(lǐng)域帶來了革命性的變化?，F(xiàn)在有很多人對(duì)于大模型的應(yīng)用還存在有一定的排斥，尤其在日常的大學(xué)數(shù)學(xué)學(xué)習(xí)與教學(xué)中，認(rèn)為大模型的出現(xiàn)不利于學(xué)生更扎實(shí)、認(rèn)真地的學(xué)習(xí)。其實(shí)，任何技術(shù)的出現(xiàn)都有其雙面性，在大學(xué)數(shù)學(xué)基礎(chǔ)課的學(xué)習(xí)過程中，我們認(rèn)為，好的大模型對(duì)于咱們更好地理解問題，打牢基礎(chǔ)，解題能力和學(xué)習(xí)效率的提升還是具有很大作用的，尤其能夠彌補(bǔ)像高等數(shù)學(xué)、線性代數(shù)、概率論與數(shù)理統(tǒng)計(jì)這樣的大班教學(xué)與學(xué)習(xí)環(huán)節(jié)中的實(shí)時(shí)反饋的不足，針對(duì)學(xué)生日常遇到的基礎(chǔ)、常規(guī)性的問題能夠提供及時(shí)的互動(dòng)。

當(dāng)前國(guó)產(chǎn)大模型的大學(xué)數(shù)學(xué)基礎(chǔ)課程的解題能力究竟如何，它們又能怎樣促進(jìn)我們解題能力的提升，及時(shí)幫助我們解決學(xué)習(xí)中遇到的問題呢？我們借助2025年考研數(shù)學(xué)一試卷（相對(duì)來說考研數(shù)學(xué)一、二、三中，應(yīng)該數(shù)學(xué)一最難，覆蓋內(nèi)容最廣），一起來測(cè)試一下當(dāng)前具有代表性的四家國(guó)產(chǎn)大模型，看看它們的真實(shí)智商水平到底如何。我們選擇的四家大模型及版本如下（都選擇電腦網(wǎng)頁(yè)版）：

Kimi：點(diǎn)選新推出的Kimi k1 視覺思考版，如下圖，打開網(wǎng)站后點(diǎn)擊下面的“Kimi k1 視覺思考模型搶先體驗(yàn)”，進(jìn)入最新的思考模型版本。網(wǎng)址：

https://kimi.moonshot.cn

DeepSeek：打開“深度思考”，如下圖，打開網(wǎng)站后點(diǎn)擊下面的“深度思考”開關(guān)，使其從黑色變?yōu)樗{(lán)色即為打開狀態(tài)。網(wǎng)址：

https://chat.deepseek.com

字節(jié)豆包：處理方式?jīng)]有選擇，選用默認(rèn)模式?？梢栽诓僮鲿r(shí)點(diǎn)擊列出的“解題答疑”，如下圖，也可以不選擇直接輸入。網(wǎng)址

https://www.doubao.com/chat

文心一言：非會(huì)員默認(rèn)為文心大模型3.5，為了測(cè)試的公正性，咱們選擇了會(huì)員版的最高級(jí)版本：文心大模型4.0 Turbo. 同樣輸入會(huì)話框沒有選擇，采用默認(rèn)模式。網(wǎng)址：

https://yiyan.baidu.com

2025年考研數(shù)學(xué)一試卷的測(cè)試題目來源于公眾號(hào)：考研競(jìng)賽數(shù)學(xué) 排版推送的推文，在以圖片方式輸入時(shí)使用的是帶有水印的圖片，答案也對(duì)照推文中的答案（點(diǎn)擊查看）.

那么，這些大模型在解題過程中給出的步驟究竟如何，能夠給與我們?cè)鯓拥慕忸}、學(xué)習(xí)，答疑解惑的提示呢？哪個(gè)模型給出的解題思路更完整、更規(guī)范，哪個(gè)的參考性與實(shí)用性最大呢？我們分兩種方式一起來測(cè)試一下。

批量問題求解風(fēng)格對(duì)比

首先，我們將所有選擇題集中到一張圖片來測(cè)試四個(gè)大模型的圖片識(shí)別與批量解題能力，提示詞統(tǒng)一為：給出這10個(gè)選擇題的求解過程與正確選項(xiàng)。上傳的圖片如下：

測(cè)試過程中對(duì)于結(jié)果對(duì)的直接給5分；對(duì)于得到了可以直接判定結(jié)果的表達(dá)式，而選項(xiàng)錯(cuò)誤的題目給2.5分，過程沒有直接可以得到結(jié)果的表達(dá)式和答案都錯(cuò)的給0分。最終四個(gè)模型分?jǐn)?shù)（總分50分）及對(duì)比分析如下：

Kimi視覺思考版（37.5）
兩次測(cè)試綜合得分37.5分，Kimi最大的優(yōu)勢(shì)是針對(duì)每個(gè)題目都提供了詳細(xì)的探索過程，批量圖片識(shí)別和解題能力還是比較完美和值得肯定的。尤其是每個(gè)題目都給出了必要的分析、求解過程，既使沒有做對(duì)，也可以給與我們解題過程一定的啟示。如下圖。

DeepSeek深度思考模型（15分）
不管是深度思考過程和解答過程都非常簡(jiǎn)單，沒有必要的求解步驟和過程，最終得分也不是很理想，得分僅僅15分。

豆包(10分）
求解過程相對(duì)于DeepSeek有所完善，但是正確率不高，綜合得分10分。

文心一言
對(duì)于這樣批量輸入一次求解基本上沒法執(zhí)行，每個(gè)題目都沒有明確的結(jié)果，給出的說明、提示也模棱兩可，完全需要用戶重新思考與探索。

對(duì)于批量題目圖片上傳測(cè)試結(jié)果來看，Kimi視覺思考版結(jié)果相對(duì)來說還是比較滿意的，對(duì)比而言優(yōu)勢(shì)比較明顯。那么，對(duì)于單個(gè)題目它們的表現(xiàn)如何呢，我們也一起來測(cè)試對(duì)比一下。

單個(gè)題目求解分?jǐn)?shù)對(duì)比

測(cè)試說明：為了真實(shí)測(cè)試四個(gè)大模型的真實(shí)數(shù)學(xué)解題能力，我們以完整題目的Latex文本格式，或者單個(gè)題目圖片上傳的方式逐題進(jìn)行測(cè)試，對(duì)于四個(gè)大模型采取了兩次測(cè)試的方式獲取分?jǐn)?shù)，如果第一次就測(cè)試正確，則不使用第二次；如果第一次不正確，則重新做一遍，兩次不對(duì)就不再測(cè)試。對(duì)于簡(jiǎn)答題，根據(jù)解答過程給出了步驟分，而對(duì)于19題的證明題，導(dǎo)數(shù)單調(diào)證明不等式成立的過程都比較嚴(yán)謹(jǐn)，第二步的證明大體都差不多，所以統(tǒng)一給出了6分。最終分?jǐn)?shù)對(duì)比如下：

最終的測(cè)試結(jié)果來看，本次考研數(shù)學(xué)初試數(shù)學(xué)成績(jī)，Kimi視覺思考模型、DeepSeek深度思考模型達(dá)到了不可思議的130分以上，豆包92分也及格了，文心一言82分也接近及格。

我記得今年年初的時(shí)候，感覺一些大模型做數(shù)學(xué)題還完全不盡人意，經(jīng)常答非所問，沒想到到了今年年底，卻有如此進(jìn)步，確實(shí)難得！

對(duì)于單個(gè)題目的求解風(fēng)格，我們?cè)谶x擇題（概率論與數(shù)理統(tǒng)計(jì)題）、填空題（線性代數(shù)題）、解答題（高等數(shù)學(xué)題）中各選題目的解答過程對(duì)比一起來分析一下。

單個(gè)題模型解題風(fēng)格對(duì)比

1、選擇題測(cè)試選擇題第8題：

Kimi視覺思考版解答過程：

DeepSeek深度思考模型解答過程：

豆包解答過程：

文心一言解答過程：

測(cè)試結(jié)果點(diǎn)評(píng)：對(duì)于概率論與數(shù)理統(tǒng)計(jì)的考研題，四個(gè)模型解答過程、結(jié)果都不錯(cuò)，而且都是一次答對(duì)！這也反映出歷屆考研試題中出現(xiàn)的概率統(tǒng)計(jì)題應(yīng)該普遍都是比較經(jīng)典的問題，題型、解題方法比較固定！具體表現(xiàn)如下：

Kimi：解答過程規(guī)范，過程詳盡，可閱讀性強(qiáng)，比較符合咱們的自己常見的求解思路與過程。有些求解過程有明確的解題步驟提示，思路過程分析，具有自我糾錯(cuò)和結(jié)果驗(yàn)證過程，對(duì)于我們?nèi)粘＝忸}訓(xùn)練具有比較好的指導(dǎo)意義和參考價(jià)值。
DeepSeek：最終給出的過程簡(jiǎn)明扼要，不足的是最終的結(jié)果顯示為一個(gè)代碼。而其深度思考、分析過程則非常詳盡，并且給出了結(jié)果的檢驗(yàn)過程和各種情況的討論，對(duì)于其中涉及到的知識(shí)點(diǎn)、方法有一定的啟示意義。最終給出的過程選擇的最值確定方法和Kimi思路一致?？砷喿x性需要進(jìn)一步加強(qiáng)，尤其是最終結(jié)果的顯示一般為L(zhǎng)atex文本。
豆包：豆包給出的過程步驟明確，并且附帶了相關(guān)知識(shí)點(diǎn)、公式的回顧，然后代入公式計(jì)算得到結(jié)果，其最值的確定則選用了均值不等式，簡(jiǎn)明扼要，也不缺少必要的步驟。
文心一言：步驟過程簡(jiǎn)明扼要，只是排版不是很規(guī)范，選用的最值確定方法與豆包相同。

2、填空題測(cè)試填空題第11題：

Kimi視覺思考版解答過程：

DeepSeek深度思考模型解答過程：

豆包解答過程：

文心一言解答過程：

測(cè)試結(jié)果點(diǎn)評(píng)：對(duì)于線性代數(shù)的考研題，可能這個(gè)題目原因，條件理解的復(fù)雜性，模型對(duì)問題的理解不是很到位，雖然三個(gè)模型做對(duì)，但是解答過程不是很符合題目的條件，也不完全符合填空題的求解思路。

Kimi：題目意思理解不完全正確。但是給出的討論步驟卻還可以。行列式的計(jì)算采用降階法，利用行列式等于0得到了結(jié)果。不過后面又多了很多冗余的步驟，當(dāng)然，自己也說明了自己的討論可能沒有必要！最后進(jìn)一步明確了結(jié)果，總體來說，還不錯(cuò)！
DeepSeek：深度思考和最終給出的過程比Kimi相對(duì)簡(jiǎn)明扼要，當(dāng)然也出現(xiàn)了多余的討論步驟，同樣的不足的是最終的結(jié)果顯示為一個(gè)代碼。其求解分析步驟和Kimi差不多，不過Kimi降階法的過程更詳細(xì)，對(duì)于我們理解這一方法更有實(shí)際意義。
豆包：對(duì)于這個(gè)題目的表現(xiàn)應(yīng)該來說還不錯(cuò)，其給出的過程有助于我們進(jìn)一步了解兩個(gè)方程組的解的關(guān)系的判定。行列式的計(jì)算同樣選擇了降階法，并且給出了詳細(xì)步驟，它的第2步完全可以作為這個(gè)題目的求解過程使用。
文心一言：彎彎繞繞分析一大堆，最終沒有給出需要的結(jié)果，對(duì)于這個(gè)題目的求解應(yīng)該來說完全失敗，而且分析過程也不完整，讓人總感覺意猶未盡！而且兩次測(cè)試都做錯(cuò)，并且得到的結(jié)果都是負(fù)1.

3、簡(jiǎn)答題測(cè)試

簡(jiǎn)答題第17題：

Kimi視覺思考版解答過程：

DeepSeek深度思考模型解答過程：

豆包解答過程：

文心一言解答過程：

測(cè)試結(jié)果點(diǎn)評(píng)：對(duì)于這個(gè)高等數(shù)學(xué)的考研題，應(yīng)該是非常經(jīng)典的問題，有理函數(shù)的定積分?？傮w來說前三個(gè)模型表現(xiàn)不錯(cuò)，給出正確求解過程對(duì)于這類問題的求解具有參考借鑒意義！

Kimi：過程規(guī)范，完全可以作為這個(gè)題目的標(biāo)準(zhǔn)解答過程！
DeepSeek：過程相對(duì)規(guī)范，不過給出的最終解答過程沒有Kimi詳細(xì)，對(duì)于有一定基礎(chǔ)的同學(xué)能夠直接理解其各中間過程，其思路方法、包括深度思考分析也和Kimi差不多。
豆包：同樣對(duì)于這個(gè)題目的表現(xiàn)應(yīng)該來說還不錯(cuò)，其給出的過程雖然稍顯啰嗦，但是對(duì)于對(duì)于相關(guān)步驟的理解具有一定的參考意義！
文心一言：最大的失誤竟然是部分分式分解錯(cuò)誤. 如果這個(gè)部分不錯(cuò)，后面的積分過程還是一個(gè)有效過程，個(gè)人認(rèn)為這是一個(gè)不應(yīng)該出現(xiàn)的錯(cuò)誤，畢竟屬于初等數(shù)學(xué)的內(nèi)容！而且兩次測(cè)試都出錯(cuò)了！

對(duì)于四個(gè)模型，Kimi和DeepSeek對(duì)于解題相對(duì)來說過程一般就題論題，解答過程比較專業(yè)、嚴(yán)謹(jǐn)，正確率比較高！測(cè)試過程中表現(xiàn)出來的解題思路，兩個(gè)模型的相似度比較大！而豆包與文心一言的解題過程與步驟則有類似的地方，不過豆包相對(duì)來說比文心一言表現(xiàn)要好！它們兩個(gè)最大的一個(gè)不同就是，在題目的最后給出了與當(dāng)前問題密切相關(guān)的知識(shí)點(diǎn)、方法擴(kuò)展性內(nèi)容提示。

比如點(diǎn)擊豆包后面的“常用的積分方法有哪些？”，系統(tǒng)會(huì)給出一些常用的計(jì)算方法的基本原理與適用的情況，如下圖。

這些總結(jié)性的內(nèi)容對(duì)于我們加強(qiáng)相關(guān)知識(shí)點(diǎn)的復(fù)習(xí)很有參考價(jià)值，而且還會(huì)繼續(xù)給出相關(guān)內(nèi)容的提示與引導(dǎo)，從而在層層推進(jìn)中更加系統(tǒng)化深入理解某些專題內(nèi)容。

在測(cè)試過程中還發(fā)現(xiàn)一個(gè)有意思的過程：Kimi的多次驗(yàn)證確保正確的過程分析：

這樣的過程不是針對(duì)于每個(gè)題目都會(huì)出現(xiàn)，而且每次測(cè)試的時(shí)候返回的結(jié)果與過程也不一樣！不過對(duì)于這個(gè)題目一般都可以得到正確的結(jié)果！這樣的分析過程對(duì)于相關(guān)問題的求解思路方法的理解，使用過程中要注意的事項(xiàng)都提供了一個(gè)比較好的分析！

同樣過程也出現(xiàn)在DeepSeek的深度思考過程中，并且通過對(duì)比分析最終選擇一個(gè)相對(duì)有效的過程給出解答過程！而這樣的過程在豆包和文心一言中不會(huì)出現(xiàn)，一般都是相對(duì)比較直接的得到結(jié)果。

總結(jié)

通過全套試卷的測(cè)試對(duì)比，可以看到：

Kimi視覺思考版和DeepSeek的深度思考模型：在批量題目的解答上，Kimi的優(yōu)勢(shì)非常明顯，解答過程也更規(guī)范，排版效果非常直觀，對(duì)于有些題目的執(zhí)行過程還有自我糾錯(cuò)、結(jié)果驗(yàn)算的過程；而DeepSeek的深度思考過程，也給出解答過程的思路分析和探索過程，最終給出的答案是經(jīng)過多重遴選的結(jié)果。
總的來說，Kimi的思路探索、解題步驟，尤其是對(duì)圖片的識(shí)別表現(xiàn)非常出色，136分的表現(xiàn)令人驚喜。

豆包和文心一言：豆包相對(duì)來說表現(xiàn)比較穩(wěn)定，給出的推導(dǎo)步驟相對(duì)來說比較簡(jiǎn)潔，正確率還是有一定的保證。同時(shí)，對(duì)于有些問題的求解條理非常清晰，過程步驟比較明顯，很多時(shí)候還給出了知識(shí)點(diǎn)提示。相對(duì)來說，文心一言可能側(cè)重點(diǎn)不同，對(duì)于一些非常常規(guī)的問題能夠給出簡(jiǎn)要解答過程和正確結(jié)果，但是對(duì)于一些簡(jiǎn)單問題也不能完成基本的計(jì)算，另外不同的一點(diǎn)是，不像Kimi和DeepSeek，在做不出來的時(shí)候，它們會(huì)進(jìn)行各種嘗試，可以說會(huì)窮舉很多與問題相關(guān)的方法，盡一切可能來探索問題的求解思路，而文心一言則僅僅給出文字思路提示，告訴我們它做不下去了！
不過豆包和文心一言比較的好的地方是，它們?cè)诮獯鹬髸?huì)給出進(jìn)一步探討的三個(gè)提示詞鏈接，點(diǎn)擊可以進(jìn)一步了解與問題相關(guān)的知識(shí)點(diǎn)、方法，有助于咱們進(jìn)一步加強(qiáng)與提交問題相關(guān)的內(nèi)容的理解與系統(tǒng)化學(xué)習(xí)。

以上是咱號(hào)對(duì)于四個(gè)大模型的比較分析，其中優(yōu)劣應(yīng)該從以上的測(cè)試結(jié)果和對(duì)比分析中應(yīng)該有所認(rèn)識(shí)，實(shí)際效果需要學(xué)友們進(jìn)一步自行檢測(cè)，畢竟每次提交可能結(jié)果都可能不相同，有時(shí)候還會(huì)差別比較大！以上測(cè)試過程除了文心一言使用的是會(huì)員版的模型外，其他模型只要注冊(cè)就可以免費(fèi)使用，至少在測(cè)試過程中貌似沒有任何限制。

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看