真滿血,真聯(lián)網(wǎng),真不卡!
作者 | ZeR0
編輯 | 漠影
智東西2月13日報道,今天,騰訊旗下大模型AI產(chǎn)品騰訊元寶干了件大事——接入滿血版DeepSeek R1 671B,同時可選深度思考和聯(lián)網(wǎng)搜索。
網(wǎng)頁版和移動端App均已上線。智東西體驗全程非常絲滑,沒有出現(xiàn)過卡頓或斷掉的情況。
“DeepSeek R1上線”出現(xiàn)在騰訊元寶App預(yù)覽欄最顯眼的位置。
從應(yīng)用介紹頁面可以看到,騰訊元寶已經(jīng)把DeepSeek R1作為吸引下載量的頭等看點:
智東西立即上手體驗,先隨手試了一下聯(lián)網(wǎng)效果,問:“今天是幾月幾號?”元寶經(jīng)過一大通思考分析,給出了正確答案。
上個問題簡單到浪費推理能力,我們再換一個需要花些功夫推理的問題:“今年元宵節(jié),哪些屬相需要躲月?怎么躲?”元寶給出了正確答案,還附送“傳統(tǒng)習(xí)俗無科學(xué)依據(jù)”的貼心告示。
用經(jīng)典基礎(chǔ)題“strawberry有幾個r”來測試,它也順利過關(guān)。
換個更開放的問題,比如AI成為人類后會想做什么。元寶思考后,給出了一些細膩生動的描述,看起來跟原版DeepSeek R1如出一轍。
再來考察下更有難度的信息匯總和分析能力,讓元寶一句話辣評12個AI聊天軟件。經(jīng)過一大通分析思考,元寶給出一連串刻薄的點評,還在每句話的末尾都附上了信息來源。點擊綠色逗號就能索引到參考的文章。
換成點評離日常生活更近的奶茶和咖啡品牌,它的回答也像模像樣:
接著,我們讓元寶把今天的AI新聞?wù)沓蛇m合發(fā)小紅書的格式,它按照要求給出了結(jié)果:
不過到這里,信息不可靠的問題暴露出來了。當(dāng)我點擊“谷歌Gemini 2.0上線”、“萬象認(rèn)知平臺發(fā)布”等句子后的綠色逗號信源索引,跳轉(zhuǎn)到的文章根本沒有提到任何相關(guān)信息。 說明就算用AI省事增效,該核實查證的步驟一點不能少。
我又讓元寶設(shè)計個html界面,用智東西logo藍作為主配色。元寶很快吐出代碼,右上角有一鍵復(fù)制粘貼鍵,還給出了關(guān)鍵設(shè)計特征和實際使用替換步驟的描述。
美中不足的是,元寶里沒有提供可以直接運行html的按鈕,而且html代碼中覆蓋的信息并非前面輸出內(nèi)容的完整版。
實際運行html后發(fā)現(xiàn),讓元寶用智東西logo藍設(shè)計確實是為難它了,它換用了其它藍色。
可能讓它做小紅書設(shè)計還需要再做些探索調(diào)教。我們再換個寫作測試,讓元寶用張愛玲的文風(fēng)寫一篇飛蛾撲火的故事。
是不是乍一看還挺像那么回事兒?
改 讓元寶續(xù)寫《西游記》,要求按原作者行文風(fēng)格。它在思考過程中回顧了原著風(fēng)格,然后從一些其他續(xù)寫書籍中提煉思路,設(shè)計了一個新的劫難作為續(xù)集主線,并考慮到要保持角色性格的一致性、使用半文言和加入一些幽默元素。
最終輸出的故事 從西天取經(jīng)歸來切入,風(fēng)格也大致符合要求。關(guān)鍵是它創(chuàng)作用時極短,人類哪怕把鍵盤按出火星子也沒法這么快敲完這些字。AI在寫作方面的進化速度實在令人瞠目。
元寶也有翻車的情況。比如,我讓元寶把智東西公眾號2月11日到2月13日發(fā)表的文章標(biāo)題整理成表格,它的表現(xiàn)就不及格了。輸出的結(jié)果不全,而且好幾篇的發(fā)布日期和標(biāo)題都不是原標(biāo)題。點擊來源索引后,發(fā)現(xiàn)它參考的是其他第三方賬號轉(zhuǎn)載和修改的結(jié)果。
當(dāng)我指出它參考的信源是第三方轉(zhuǎn)載、不是智東西公眾號官方發(fā)的,DeepSeek R1聯(lián)網(wǎng)版元寶又進行一大通思考,但最終給出的結(jié)果依然沒有修正。
之所以出現(xiàn)這種情況,是它在思考過程中的邏輯就有問題。正常人的思路是先找到公眾號,再文章列表;而它的方式是從全網(wǎng)信源中“廣撒網(wǎng)”,僅從文內(nèi)里有“智東西2月11日消息”、“智東西獨家對話”就武斷判定是官方發(fā)布,根本沒考慮到核查發(fā)布賬號和鏈接地址。
看來AI助手在輔助做資料整理的可靠性上,還有相當(dāng)?shù)倪M化空間。
當(dāng)然啦,瑕不掩瑜,在到處找不到好用、不崩的滿血版DeepSeek R1時,騰訊元寶的出手可謂恰逢其時、誠意滿滿。
智東西進行大量不同類型的對話測試,都沒有出現(xiàn)回答斷掉、服務(wù)器崩潰的情況,全程很穩(wěn)定,據(jù)說給元寶提供算力的騰訊云針對推理效率做了專門優(yōu)化。
安利大家親自試試,跟原版DeepSeek R1一樣香~