国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
基于DeepSeek R1模型的私有化部署實踐

DeepSeek R1

DeepSeek R1模型的成功發(fā)布,具有以下幾點重要意義:

技術突破:DeepSeek R1模型采用純強化學習(RL)訓練,無需任何監(jiān)督微調(diào)(SFT)數(shù)據(jù),即可實現(xiàn)推理能力的自主進化。這一創(chuàng)新不僅驗證了弱監(jiān)督學習在復雜認知任務中的可行性,還通過“冷啟動數(shù)據(jù)注入—推理導向強化學習—拒絕采樣優(yōu)化—全場景強化學習”的四階段訓練流程,使模型展現(xiàn)出卓越的自進化能力。此外,DeepSeek R1還通過知識蒸餾技術,將推理能力遷移到較小的模型中,使得小模型在特定任務中能夠媲美大模型。

開源精神:MIT開源策略體現(xiàn)了中國工程師對開源文化的重視和貢獻。通過開源,DeepSeek R1為全球科研社區(qū)提供了寶貴的資源,促進了國際間的合作與交流。

全球影響力:標志著中國工程師在人工智能領域從跟隨者向自主創(chuàng)新者的轉變,提升了中國在全球AI領域的影響力,也為中國企業(yè)在國際市場上贏得了更多的話語權。

應對挑戰(zhàn):在面對美國對先進半導體的出口管制時,DeepSeek R1的成功表明中國工程師能夠在有限的資源下,通過自主創(chuàng)新實現(xiàn)技術突破。

要想私有化部署 DeepSeek R1 模型首先需要搭建 GPU 算力集群

GPUStack

GPUStack 是由梁勝博士帶領的Seal團隊,設計并開源的支持基于任何品牌的異構 GPU 集群管理器。 以下是 GPUStack 的主要特性:

1. 廣泛的硬件兼容性

  • 多平臺支持:支持 macOS、Windows (10, 11) 和多種 Linux 發(fā)行版(如 Ubuntu >= 20.04, Debian >= 11, RHEL >= 8, Rocky >= 8, Fedora >= 36, OpenSUSE >= 15.3 (leap), OpenEuler >= 22.03)。
  • 多架構支持:支持 AMD64 和 ARM64 架構。
  • 多 GPU 支持:支持多種品牌的 GPU,包括 Apple Metal、NVIDIA CUDA、華為昇騰、摩爾線程等。

2. 廣泛的模型支持

  • 多種模型類型:支持大型語言模型(LLMs)、擴散模型、音頻模型、嵌入模型和重新排序模型。
  • 模型部署:支持從 Hugging Face、ModelScope、Ollama Library 和本地路徑部署模型。
  • 推理引擎:支持 vLLM、llama-box(基于 llama.cpp 與 stable-diffusion.cpp)和 vox-box 推理引擎。

3. 可擴展性和分布式推理

  • 單節(jié)點多 GPU 和多節(jié)點推理:支持單節(jié)點多 GPU 和多節(jié)點推理及服務,可以輕松擴展操作規(guī)模。
  • 分布式推理:對于無法在單個 GPU 節(jié)點運行的大參數(shù)量模型,GPUStack 提供分布式推理功能,可以自動將模型運行在跨主機的多個 GPU 上。
  • 調(diào)度優(yōu)化:優(yōu)化自動調(diào)度優(yōu)先級,將分布式推理的優(yōu)先級調(diào)整至高于 CPU 推理,增強了手動調(diào)度選卡功能,支持選擇多卡,包括單機多卡(vLLM)和多機多卡(llama-box)。

4. 輕量級設計和兼容性

  • 輕量級 Python 包:依賴項和操作開銷最小,提供與 OpenAI 標準兼容的 API。
  • OpenAI 兼容 API:提供與 OpenAI 標準兼容的 API,開發(fā)人員可以通過 OpenAI 兼容的 API 訪問私有模型服務。

5. 企業(yè)級管理能力

  • 用戶和 API 密鑰管理:簡化了用戶和 API 密鑰的管理。
  • GPU 指標監(jiān)控:實時監(jiān)控 GPU 性能和利用率。
  • 令牌使用和速率限制:追蹤令牌使用情況并有效管理速率限制。

6. 新增特性(v0.5 版本)

  • 模型 Catalog:提供經(jīng)過驗證的模型集合,簡化模型部署流程,降低用戶認知負擔。
  • 增強 Windows 和 macOS 模型支持:將 VLM 多模態(tài)模型支持和 Tool Calling 能力擴展到 Windows 和 macOS 平臺。
  • 圖生圖功能:為 Image 模型新增圖生圖(圖像編輯)功能,提供對應的 API 和 Playground UI。
  • 模型管理優(yōu)化:新增模型啟動檢查功能,支持模型的停止和啟動操作,支持對無法自動識別的模型進行手動分類。
  • 擴展集成能力:增加了 AMD GPU 支持,為 Dify 的 GPUStack Provider 添加了 STT 和 TTS 語音模型支持,提供了 RAGFlow 的 GPUStack Provider。

安裝 GPUStack

$ curl -sfL https://get.gpustack.ai | sh -s -

安裝完成后訪問 localhost

查看資源

擴展算力

部署DeepSeek R1模型

由于筆者僅用了一臺M2 Pro芯片的機器,所以這里選擇80億個參數(shù)的模型

確保模型已經(jīng)安裝完成并處于 Running 狀態(tài)

測試

進入試驗場并設置系統(tǒng)消息

基于私有大模型構建智能體

首先需要在GPUStack創(chuàng)建API訪問密鑰

創(chuàng)建AI工程

創(chuàng)建一個文件夾 deepseek 然后初始化 node.js 項目

(base) ?  deepseek tree ..├── package.json├── src│   └── index.ts├── tsconfig.build.json└── tsconfig.json

安裝 typescript 和 tsx

pnpm add typescript -Dpnpm add tsx -D

package.json 的內(nèi)容

{  'name': 'deepseek',  'version': '1.0.0',  'scripts': {    'dev': 'tsx --watch src/index.ts'  },  'devDependencies': {    'tsx': '^4.19.2',    'typescript': '^5.7.3'  }}

安裝依賴

安裝Vercel AI SDK

pnpm add ai

由于GPUStack提供OpenAI兼容API所以我們直接使用OpenAI Provider

pnpm add @ai-sdk/openai

代碼示例

import { generateText } from 'ai'import { createOpenAI } from '@ai-sdk/openai'const openai = createOpenAI({ apiKey: '你的 GPUStack API 密鑰', baseURL: 'http://127.0.0.1/v1-openai'});async function main() { const { text } = await generateText({ model: openai('deepseek-r1'), prompt: '請編寫一段關于DeepSeek R1模型的介紹' }); console.log(text);};main();

執(zhí)行效果

本站僅提供存儲服務,所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
OpenAI科學家盛贊中國大模型:算法非常強,算力用到極致!
“神秘東方力量”下場AI震驚硅谷,AMD緊急站隊
美分析機構稱DeepSeek V3 成本遠超600 萬美元,實際達13億美元!
超越ChatGPT登頂 Deepseek被“擠”到宕機!或將推動AI應用爆發(fā)
不吹不黑:關于DeepSeek的高級別會議紀要
對OpenAI發(fā)起直接挑戰(zhàn),DeepSeek“殺入”文生圖領域
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服