国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
DeepSeek朝硅谷“開了一槍”(圖文)

2025年01月27日  來源: 科創(chuàng)板日報

  幾乎是一夜之間,“來自東方的神秘力量”又一次擊中海外人士心臟。

  近兩日,國產(chǎn)AI黑馬DeepSeek(深度求索)在全球科技界刷屏。新模型發(fā)布后的訪問量激增,一度讓DeepSeek閃崩,但問題在數(shù)分鐘內(nèi)得到解決。AI界上一次出現(xiàn)宕機情況,還是月之暗面的Kimi出圈爆火之時。

  截至發(fā)稿,DeepSeek在美區(qū)蘋果App Store的免費排行榜中飆升至第二,第一是ChatGPT。

  ▍與OpenAI“掰手腕”

  DeepSeek本次“刷屏”,起因是1月20日其正式發(fā)布推理大模型DeepSeek-R1,該模型在數(shù)學(xué)、編程和推理等關(guān)鍵領(lǐng)域的表現(xiàn),能與OpenAI的最強推理模型o1“掰手腕”,但其API調(diào)用成本卻低了90%-95%。

  DeepSeek-R1的驚艷表現(xiàn),先是引發(fā)了海外市場的強烈關(guān)注。在美國,多位AI行業(yè)的資深專家和從業(yè)者盛贊DeepSeek-R1。

  美國計算機科學(xué)家、薩姆·奧爾特曼的導(dǎo)師吳恩達在第55屆世界經(jīng)濟論壇(冬季達沃斯)上點贊DeepSeek——“我對 DeepSeek 的進展印象深刻。我認(rèn)為他們能夠以非常經(jīng)濟的方式訓(xùn)練模型。他們最新發(fā)布的推理模型,非常出色……'加油’!”。

  微軟CEO薩蒂亞·納德拉也公開表示,“他們(DeepSeek)切實有效地開發(fā)出了一款開源模型,在推理計算方面表現(xiàn)出色,且超級計算效率極高?!奔{德拉還強調(diào),“我們必須非常、非常認(rèn)真地對待中國的這些進展”。

  DeepSeek成立于2023年5月,其背后是國內(nèi)對沖基金巨頭幻方量化。

  2023年11月2日,DeeSeek推出首個模型DeepSeek Coder,該模型免費供商業(yè)使用且完全開源。2023年11月29日,DeepSeek LLM上線,其參數(shù)規(guī)模達到 67B,性能接近 GPT-4,同時還發(fā)布了該模型的聊天版本 DeepSeek Chat。

  真正讓Deepseek在AI界出圈的,是其在2024年5月開源的第二代MoE大模型DeepSeek-V2。該模型在性能上比肩GPT-4 Turbo,價格卻只有GPT-4的百分之一,DeepSeek由此被稱作“價格屠夫”、“AI界的拼多多”。

  隨后的2024年下半年,這家公司還先后發(fā)布了DeepSeek R1-lite-preview和DeepSeek-V3。

  到了2025年推出的R1模型,在數(shù)學(xué)能力測試中,該模型在MATH基準(zhǔn)測試上達到了77.5%的準(zhǔn)確率,與OpenAI的o1不相上下;在編程領(lǐng)域,R1在Codeforces評測中達到了2441分的水平,高于96.3%的人類參與者。

  而這一切,是在不到600萬美元的投入和2048塊低性能的H800芯片的條件下完成的,訓(xùn)練時間僅用兩個月。這種“四兩撥千斤”的模式,顛覆了人們對OpenAI“大力出奇跡”式的固有認(rèn)知,結(jié)果令全球側(cè)目。

  ▍為何是DeepSeek?

  在國內(nèi)7家頭部的大模型創(chuàng)業(yè)公司當(dāng)中,DeepSeek可以說是最不顯山不露水的一家。在各個大模型廠商早已開啟買量,進行廣告投放品牌營銷時,據(jù)《科創(chuàng)板日報》記者了解,這家公司至今尚未有公關(guān)團隊。

  2023年4月,幻方量化宣布成立新組織,集中資源和力量,探索AGI的本質(zhì)。當(dāng)時幻方就表示,多年以來,公司堅持把營收的大部分投入人工智能領(lǐng)域,建設(shè)領(lǐng)先的AI硬件基礎(chǔ)設(shè)施,進行大規(guī)模的研究,探索人類未知的奧秘。

  如今來看,在這一年多時間里,DeepSeek的進展迅速。當(dāng)下的AI戰(zhàn)事進入中場,戰(zhàn)況尤為激烈,為何是DeepSeek先讓硅谷 “慌了神”?

  近期,在微信朋友圈中,《科創(chuàng)板日報》記者注意到,不少AI領(lǐng)域的從業(yè)者和投資人,對此進行了分析討論。除了技術(shù)實力本身,團隊的創(chuàng)新理念和人才隊伍,是業(yè)內(nèi)人士認(rèn)為DeeSeek能在群狼環(huán)伺的AI界殺出重圍的主要原因。

  幻方量化和DeepSeek創(chuàng)始人梁文鋒,畢業(yè)于浙江大學(xué)信息與通信工程專業(yè)。業(yè)內(nèi)口碑稱,這是一位極致的80后技術(shù)理想主義者。創(chuàng)立幻方,梁文鋒就在幕后潛心鉆研技術(shù),在DeepSeek時代,其依舊延續(xù)著低調(diào)作風(fēng),和一線研究員一樣,每天“看論文,寫代碼,參與小組討論”。

  “過去很多年,中國公司習(xí)慣了別人做技術(shù)創(chuàng)新,我們拿過來做應(yīng)用變現(xiàn),但這并非是一種理所當(dāng)然。這一波浪潮里,我們的出發(fā)點,就不是趁機賺一筆,而是走到技術(shù)的前沿,去推動整個生態(tài)發(fā)展?!痹诮邮堋栋涤俊返牟稍L中,梁文鋒說。

  DeepSeek的招聘公告中,赫然寫著“頂尖人才招聘”。公開信息顯示,目前的DeepSeek團隊,集結(jié)了一批國內(nèi)名校畢業(yè)的高密度年輕人才,其中不乏應(yīng)屆生、實習(xí)生。在這里,工作經(jīng)驗不再是衡量人才的唯一標(biāo)準(zhǔn)。DeepSeek的HR在社交媒體平臺表示,“著重考察人選素質(zhì)和對大模型的熱愛”。

  只要員工的技術(shù)提案有潛力,他們所需算力和資源都能得到充分滿足。在大模型領(lǐng)域,算力是稀缺的資源,DeepSeek則是“萬卡GPU訓(xùn)練集群,無需申請,不限使用”。

  對于這些人才,多名熟悉DeepSeek的AI業(yè)內(nèi)人士也反饋,給出的薪酬極具競爭力。

  “投身于探索 AGI 的本質(zhì),不做中庸的事,帶著好奇心,用最長期的眼光去回答最大的問題”,這是DeepSeek官方微信號寫下的簡介。某種程度上,DeepSeek代表了中國“硬核技術(shù)創(chuàng)新”的敘事。可喜的是,DeepSeek并非孤例。

  前不久,宇樹科技發(fā)布了一段最新機器狗產(chǎn)品B2-W的演示視頻,視頻中B2-W機器狗展現(xiàn)了一系列高難度動作,這引來馬斯克點贊轉(zhuǎn)發(fā)評論,火爆全網(wǎng)。

  幾乎是在一同期,黃仁勛的英偉達中國年會之行中,宇樹科技CEO王興興受邀參與,一行人當(dāng)中,還有銀河通用創(chuàng)始人兼CTO王鶴、深涌智能Emerging AI創(chuàng)始人黃可鋮等。

  以這些硬核技術(shù)的創(chuàng)業(yè)者和公司為代表,他們正在開啟一個中國創(chuàng)新故事的新篇章。

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
國產(chǎn)AI卷翻硅谷,奧特曼發(fā)文“陰陽”,類o1模型都在卷什么?
中國AI太強,Meta工程師自曝瘋狂熬夜復(fù)制DeepSeek
中國大模型價格戰(zhàn)背后的真相
Kimi的數(shù)學(xué)模型來了,這次甚至能挑戰(zhàn)高考
2024,“大模型六小虎”逐夢AI圈
OpenAI科學(xué)家盛贊中國大模型:算法非常強,算力用到極致!
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服