DeepSeek R1
DeepSeek R1模型的成功發(fā)布,具有以下幾點重要意義:
技術突破:DeepSeek R1模型采用純強化學習(RL)訓練,無需任何監(jiān)督微調(diào)(SFT)數(shù)據(jù),即可實現(xiàn)推理能力的自主進化。這一創(chuàng)新不僅驗證了弱監(jiān)督學習在復雜認知任務中的可行性,還通過“冷啟動數(shù)據(jù)注入—推理導向強化學習—拒絕采樣優(yōu)化—全場景強化學習”的四階段訓練流程,使模型展現(xiàn)出卓越的自進化能力。此外,DeepSeek R1還通過知識蒸餾技術,將推理能力遷移到較小的模型中,使得小模型在特定任務中能夠媲美大模型。
開源精神:MIT開源策略體現(xiàn)了中國工程師對開源文化的重視和貢獻。通過開源,DeepSeek R1為全球科研社區(qū)提供了寶貴的資源,促進了國際間的合作與交流。
全球影響力:標志著中國工程師在人工智能領域從跟隨者向自主創(chuàng)新者的轉變,提升了中國在全球AI領域的影響力,也為中國企業(yè)在國際市場上贏得了更多的話語權。
應對挑戰(zhàn):在面對美國對先進半導體的出口管制時,DeepSeek R1的成功表明中國工程師能夠在有限的資源下,通過自主創(chuàng)新實現(xiàn)技術突破。
要想私有化部署 DeepSeek R1 模型首先需要搭建 GPU 算力集群
GPUStack
GPUStack 是由梁勝博士帶領的Seal團隊,設計并開源的支持基于任何品牌的異構 GPU 集群管理器。 以下是 GPUStack 的主要特性:
1. 廣泛的硬件兼容性
2. 廣泛的模型支持
3. 可擴展性和分布式推理
4. 輕量級設計和兼容性
5. 企業(yè)級管理能力
6. 新增特性(v0.5 版本)
安裝 GPUStack
$ curl -sfL https://get.gpustack.ai | sh -s -
安裝完成后訪問 localhost
查看資源
擴展算力
部署DeepSeek R1模型
由于筆者僅用了一臺M2 Pro芯片的機器,所以這里選擇80億個參數(shù)的模型
確保模型已經(jīng)安裝完成并處于 Running 狀態(tài)
測試
進入試驗場并設置系統(tǒng)消息
基于私有大模型構建智能體
首先需要在GPUStack創(chuàng)建API訪問密鑰
創(chuàng)建AI工程
創(chuàng)建一個文件夾 deepseek 然后初始化 node.js 項目
(base) ? deepseek tree ..├── package.json├── src│ └── index.ts├── tsconfig.build.json└── tsconfig.json
安裝 typescript 和 tsx
pnpm add typescript -Dpnpm add tsx -D
package.json 的內(nèi)容
{ 'name': 'deepseek', 'version': '1.0.0', 'scripts': { 'dev': 'tsx --watch src/index.ts' }, 'devDependencies': { 'tsx': '^4.19.2', 'typescript': '^5.7.3' }}
安裝依賴
安裝Vercel AI SDK
pnpm add ai
由于GPUStack提供OpenAI兼容API所以我們直接使用OpenAI Provider
pnpm add @ai-sdk/openai
代碼示例
import { generateText } from 'ai'import { createOpenAI } from '@ai-sdk/openai'const openai = createOpenAI({ apiKey: '你的 GPUStack API 密鑰', baseURL: 'http://127.0.0.1/v1-openai'});async function main() { const { text } = await generateText({ model: openai('deepseek-r1'), prompt: '請編寫一段關于DeepSeek R1模型的介紹' }); console.log(text);};main();
執(zhí)行效果