現(xiàn)在DeepSeek-R1大模型太火爆了,導致官網(wǎng)服務器壓力太大,經(jīng)常無法使用。由于DeepSeek-R1大模型是開源的,很多第三方平臺已經(jīng)支持部署DeepSeek-R1大模型。在這些平臺上,可以建立獨屬于自己的DeepSeek-R1大模型服務,想怎么用就怎么用,再也不會卡頓。騰訊云 TI 平臺目前已經(jīng)支持DeepSeek-R1大模型,部署完成后體驗很不錯。
騰訊云 TI 平臺(https://cloud.tencent.com/product/ti)是為 AI 工程師打造的一站式機器學習服務平臺,提供從數(shù)據(jù)預處理、模型構(gòu)建、模型訓練到模型評估的全流程開發(fā)支持。平臺內(nèi)置豐富的算法組件,支持多種算法框架,滿足多種 AI 應用場景的需求。
以下是平臺的主要特性和功能:
模型訓練的完整閉環(huán):覆蓋從數(shù)據(jù)預處理、模型構(gòu)建、模型訓練到模型評估的全工作流程,形成機器學習訓練的完整閉環(huán)。
全自動建模:平臺可自動完成建模的全流程,無基礎(chǔ)的 AI 初學者也可毫無障礙地完成整個訓練流程。自動調(diào)參工具可大幅提升 AI 工程師的調(diào)參效率。
靈活的資源調(diào)度:支持多種 CPU/GPU 資源,符合用戶對差異化算力的場景需求。采用靈活的計費方式,幫助用戶降本增效。
多種學習框架:囊括多種學習框架,如 PySpark、Spark、PyTorch、TensorFlow 等,滿足不同開發(fā)者的使用需求與習慣。
彈性模型服務部署:內(nèi)置模型服務模塊,支持虛擬化異構(gòu)算力和彈性擴縮容能力,支持部署多種模型格式、服務流量分配與滾動更新,以支撐在線推理場景中的多元應用訴求。
多實例調(diào)度:支持手工、定時、批量參數(shù)和重跑四種實例調(diào)度方式,降低手工調(diào)度的次數(shù)與時間成本。
交互式建模:面向?qū)I(yè)用戶的交互式代碼開發(fā)環(huán)境,內(nèi)置多種學習框架,支持 Python、R,通過 TI-SDK 和平臺功能打通,提供實時資源監(jiān)控,并支持 git 進行代碼管理。
數(shù)據(jù)標注與管理:支持創(chuàng)建與管理文本、圖片、表格等多種格式數(shù)據(jù)類型的集合,在線即可對數(shù)據(jù)內(nèi)容進行詳情預覽并進行數(shù)據(jù)源標注,一站式完成機器學習數(shù)據(jù)準備。支持導入已標注的圖片數(shù)據(jù),兼容業(yè)內(nèi)通用 Pascal Voc、COCO 格式,標注信息擁有分布統(tǒng)計與可視化展示能力。
便捷的效果可視化:對源數(shù)據(jù)的強大可視化交互數(shù)據(jù)解析,讓用戶高效直觀地了解數(shù)據(jù)的全貌。模型訓練效果直接懸浮呈現(xiàn),用戶無需點擊即可直觀方便地辨別模型的質(zhì)量,判斷優(yōu)化方案。
騰訊云 TI 平臺的應用場景
金融領(lǐng)域:可以根據(jù)歷史成交數(shù)據(jù)訓練匹配模型,預測客戶和商品的最優(yōu)匹配,提升營銷效果、降低營銷成本、挖掘潛在客戶、實現(xiàn)交叉銷售等。
圖像分類:利用自動學習完成圖像分類,適用于各類通用圖像分類模型自學習場景。
物體檢測:利用自動學習完成圖片中杯盤位置及顏色的識別檢測,適用于餐飲行業(yè)的自動化杯盤檢測場景。
文本分類:利用自動學習完成文本分類任務,適用于新聞分類、情感分析等場景。
OCR 票據(jù)識別:利用自動學習完成 OCR 識別,適用于實現(xiàn)各類表單、票據(jù)、證件、單據(jù)等的結(jié)構(gòu)化信息提取。
目前,騰訊云 TI 平臺已全面接入混元、Llama3、Llama2 、DeepSeek等主流開源大模型,用戶可以快速部署和體驗這些模型,助力業(yè)務場景的 AI 應用。用戶可以通過騰訊云 TI 平臺一鍵部署 DeepSeek 模型,無需手動下載,直接預裝到服務中,進行模型訓練和推理效果測試。騰訊云 TI 平臺支持按量計費和包年包月(資源組)兩種定價模式,具體價格根據(jù)用戶選擇的資源類型、數(shù)量和使用時長等因素而定。
DeepSeek 模型的具體部署流程:
首選注冊一個騰訊云賬戶,創(chuàng)建一個服務角色
點擊同意授權(quán)
同意賦予 騰訊云 TI 平臺 TI-ONE 權(quán)限后,將創(chuàng)建服務預設角色并授予 騰訊云 TI 平臺 TI-ONE 相關(guān)權(quán)限,該角色將在已關(guān)聯(lián)策略的權(quán)限范圍內(nèi)訪問您的其他云服務資源。
在大模型廣場可以看到DeepSeek 系列模型的介紹:DeepSeek系列模型是一組全新的大型語言模型,旨在提供高效、靈活且強大的自然語言處理能力。該系列模型通過創(chuàng)新的架構(gòu)設計和優(yōu)化算法,支持多種任務和應用場景,包括文本生成、對話系統(tǒng)、信息檢索等。
系列模型清單
DeepSeek-V3
DeepSeek-R1
DeepSeek-R1-Distill-Qwen-1.5B
DeepSeek-R1-Distill-Qwen-7B
DeepSeek-R1-Distill-Llama-8B
DeepSeek-R1-Distill-Qwen-14B
DeepSeek-R1-Distill-Qwen-32B
DeepSeek-R1-Distill-Llama-70B
推理資源要求:DeepSeek-V3 與 DeepSeek-R1 需要多機分布式部署,2節(jié)點H20*8卡資源,其他蒸餾模型所需資源詳見大模型推理所需資源指南
在模型介紹的右邊,可以進行DeepSeek模型體驗,進行對話。
然后點擊創(chuàng)建服務:
機器來源:可以購買CVM機器或者從TI-ONE 平臺購買。
騰訊云 CVM(Cloud Virtual Machine)是騰訊云提供的虛擬機服務,允許用戶在云平臺上創(chuàng)建、運行和管理虛擬服務器。
騰訊云TI-ONE 是為 AI 工程師打造的一站式機器學習平臺,為用戶提供從數(shù)據(jù)準備、模型訓練、模型評測到模型服務部署的全流程支持。TI-ONE 支持多種訓練方式和算法框架,并已全面支持 LLM 大模型的增訓(Post-Pretrain)和有監(jiān)督精調(diào)(SFT),滿足不同 AI 場景的需求。
計費模式:可以選擇按量計費或者包年包月
部署方式:標準部署或者多機分布式部署
模型來源:選擇鏡像,然后選擇Deepseek-ri模型
高級設置里面,可以選擇不同的算力配置,比如:
8C32G T4*1
20C80G T4*1
32C128G T4*1
40C160GT4*2
80C320G T4*4
8C32G T4*1代表的算力配置是:
處理器:8 個 vCPU,基于騰訊云自研星星海服務器,采用 AMD EPYC? Bergamo 處理器,睿頻 3.1 GHz。
內(nèi)存:32GB DDR4 內(nèi)存,提供穩(wěn)定的內(nèi)存性能。
GPU:1 個 NVIDIA Tesla T4 GPU,具備強大的圖形處理和并行計算能力。
網(wǎng)絡:內(nèi)網(wǎng)帶寬 10Gbps,網(wǎng)絡收發(fā)包能力 140 萬 PPS。
存儲:支持云盤和本地盤,存儲 IOPS 可達 100 萬,存儲時延低至 40us。
適用場景:適用于中小型數(shù)據(jù)庫、緩存集群、視頻直播等場景。
12C44GB A10*1
28C116GB A10*1
56C232GB A10*2
112C466GB A10*4
12C44GB A10*1的算力配置是:
型號:TI.GNV4.3XLARGE44.POST
規(guī)格:12 核 44GB A10*1
刊例價:¥11.17 元/時
支持模塊:自動學習、任務式建模、Notebook、在線服務、模型評測、可視化建模
配置完成后,會顯示服務配置費用:9.55元/小時
騰訊云會預先凍結(jié)費用,使用按量計費功能需預先凍結(jié)所選配置兩個小時的費用,若現(xiàn)金賬戶余額不足,要先進行充值。
充值完成后,點擊:啟動服務,就可以穩(wěn)定使用獨屬于自己的Deepseek大模型服務了。