国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
從零開始:使用DeepSeek-R1 實(shí)現(xiàn)高效的本地 RAG

有小伙伴私信我,DeepSeek-R1能用來搭建 RAG(檢索增強(qiáng)生成)系統(tǒng)嗎?答案是絕對可以!

春節(jié)前夕,我們接到了業(yè)務(wù)方的緊急任務(wù),需要探討如何將 DeepSeek-R1 快速集成到即將上線的項(xiàng)目中。經(jīng)過多次深入討論,我們團(tuán)隊(duì)決定在現(xiàn)有 RAG 系統(tǒng)的一個核心模塊中試用 DeepSeek-R1,替換掉原有的 Qwen 模型。更換完成后,我們對系統(tǒng)進(jìn)行了一系列嚴(yán)格的測試,以確保其穩(wěn)定運(yùn)行。在經(jīng)過徹底驗(yàn)證后,我們成功地在除夕之夜將系統(tǒng)上線。

鑒于所處理數(shù)據(jù)的敏感性,本文將詳盡介紹如何使用DeepSeek-R1、LangChain、Ollama和Streamlit搭建一個本地的、專門處理PDF文件的RAG系統(tǒng)。這套系統(tǒng)利用LangChain的模塊化特點(diǎn)和DeepSeek-R1的隱私保護(hù)能力,非常適合處理技術(shù)文檔、法律文件及學(xué)術(shù)資料等。在后續(xù)的分享中,我將詳細(xì)介紹如何利用 DeepSeek-R1 對系統(tǒng)進(jìn)行Fine-tuning和優(yōu)化的過程。

此項(xiàng)目整合了 LangChain(一種用于 RAG 工作流程的 AI 框架)、Ollama(負(fù)責(zé) DeepSeek-R1 的本地部署)和 Streamlit(提供用戶界面)。最終成品是一個 AI 助手,它能在本地處理 PDF 文件,并以高精確度和速度回答問題。

在此次演示中,我們將使用一個參數(shù)為 7B 的 DeepSeek-R1 精簡模型。但如果你的計算資源更充足,我建議嘗試使用其他版本的 DeepSeek-R1 精簡模型。

為什么選擇本地部署的 RAG 解決方案?

雖然云端 AI 解決方案功能強(qiáng)大,但它們往往涉及到隱私和成本問題。使用 LangChain 的模塊化框架,你可以在本地搭建一個 RAG 系統(tǒng),這樣做有幾大優(yōu)點(diǎn):

  • 數(shù)據(jù)隱私:所有的操作都在你自己的設(shè)備上完成,數(shù)據(jù)安全得到保障。
  • 成本效率:避免了昂貴的 API 訂閱費(fèi)用,這個方案不僅免費(fèi)還是開源的。
  • 高度定制化:你可以根據(jù)需要調(diào)整文檔檢索和回答生成的具體流程。
  • 強(qiáng)大的 AI 能力:整合了 DeepSeek-R1,這是一款專為解決復(fù)雜問題和技術(shù)任務(wù)而設(shè)計的模型。

所用工具和技術(shù):LangChain, DeepSeek-R1, Ollama, ChromaDB 和 Streamlit

這個項(xiàng)目涵蓋了以下幾個部分:

  • LangChain:這是構(gòu)建 RAG 工作流程的核心框架,支持集成文檔加載、向量存儲和大型語言模型(LLM)。它的模塊化設(shè)計讓你可以根據(jù)具體需求進(jìn)行調(diào)整。
  • DeepSeek-R1:一種專為編程、問題解決和技術(shù)任務(wù)優(yōu)化的推理型語言模型。它提供了多種本地部署的版本,可通過 Ollama 輕松部署。
  • Ollama:一個命令行工具,用于簡化本地大型語言模型和嵌入模型(如 DeepSeek-R1 和 mxbai-embed-large)的部署與管理。
  • ChromaDB:一個向量數(shù)據(jù)庫,能存儲和檢索文檔向量,方便進(jìn)行基于相似性的快速查詢。
  • Streamlit:一個 Python 庫,用于創(chuàng)建易于操作的 Web 用戶界面,使你的 RAG 應(yīng)用更加用戶友好,易于使用。

構(gòu)建 RAG 工作流:分步指南

以下是如何設(shè)置你的本地 ChatPDF 解決方案:

1. 安裝先決條件

確保你已經(jīng)安裝了 Python 3.8 和Ollama。運(yùn)行以下命令:

curl -fsSL https://ollama.com/install.sh | shollama -v # 驗(yàn)證安裝

下載所需的 AI 模型:

ollama pull deepseek-r1:latest # 默認(rèn) 7B 模型ollama pull mxbai-embed-large  # 嵌入模型

2. 項(xiàng)目設(shè)置

克隆倉庫并設(shè)置虛擬環(huán)境:

git clone https://github.com/paquino11/chatpdf-rag-deepseek-r1.gitcd chatpdf-rag-deepseek-r1python3 -m venv venvsource venv/bin/activate

安裝依賴:

pip install -r requirements.txt

3. 啟動Streamlit

啟動 Streamlit 應(yīng)用:

streamlit run app.py

在瀏覽器中訪問http://localhost:8501。上傳你的 PDF 文件,調(diào)整檢索設(shè)置,開始提問。

使用 DeepSeek-R1、Ollama、LangChain 和 ChromaDB 構(gòu)建 RAG 管道

這個項(xiàng)目我將利用 LangChain 來從零開始搭建的文檔處理流程:

  1. PDF 文件的處理: 利用 LangChain 讀取 PDF 文件,并將其分割成小塊。 使用 Ollama 將這些小塊轉(zhuǎn)換成向量形式,便于計算機(jī)理解和處理。
  2. 文檔的查找: 通過 ChromaDB 這個工具,快速找到與你問題最相關(guān)的文檔部分。 你可以設(shè)置想要查找的結(jié)果數(shù)量和查找的嚴(yán)格程度。
  3. 生成回答: DeepSeek-R1 會拿到這些相關(guān)的文檔小塊,然后生成準(zhǔn)確的回答。 LangChain 確保這些回答格式對用戶友好,易于理解。

調(diào)整設(shè)置以獲得更好的結(jié)果

LangChain 允許你輕松調(diào)整設(shè)置,以優(yōu)化搜索結(jié)果:

  • 檢索結(jié)果數(shù)量(k):這個參數(shù)決定了將使用多少文檔片段來生成答案。如果設(shè)置的數(shù)目較多,可以獲得更全面的答案,但響應(yīng)時間會變慢;如果設(shè)置的數(shù)目較少,響應(yīng)速度會加快,但可能因信息不足而影響答案的全面性。
  • 相似度閾值(score_threshold):這個參數(shù)用于設(shè)定檢索時的匹配嚴(yán)格度。閾值設(shè)定得高,只有最相關(guān)的文檔片段才會被檢索出來;閾值設(shè)定得低,雖然能檢索到更多的信息,但可能會包括一些相關(guān)性不高的內(nèi)容。

如何使用和測試你的 RAG 應(yīng)用

這里介紹幾種常見的場景,幫助你測試你的應(yīng)用程序:

測試用的 PDF 文件:

  • 金融:分析財務(wù)報告,挖掘出可實(shí)施的商業(yè)見解。
  • 醫(yī)療保健:總結(jié)醫(yī)學(xué)研究論文或指南,提取關(guān)鍵信息。
  • 教育:從電子書和學(xué)術(shù)論文中提取摘要或主要觀點(diǎn)。

示例問題:

  • “這個 Python 庫的核心功能有哪些?”
  • “這份合同的第五部分主要討論了什么內(nèi)容?”
  • “簡要概述這本電子書的第二章。”

結(jié)論

結(jié)合 LangChain、DeepSeek-R1 和 ChromaDB 的使用,你可以構(gòu)建一個重視隱私保護(hù)、靈活性和成本效率的 RAG 系統(tǒng)。這種本地化的解決方案非常適用于分析技術(shù)性文件和法律文件,無需依賴于云服務(wù)。如此一來,你便可以在完全控制數(shù)據(jù)安全的環(huán)境下,有效地處理和分析專業(yè)文檔。

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
Deepseek R1打造本地化RAG知識庫:安裝部署使用詳細(xì)教程
LlamaIndex ollama 搭建本地RAG應(yīng)用,建立本地知識庫
Deepseek最近那叫一個火,搞得搭建本地知識庫也成熱門事兒了
Chroma Ollama 搭建本地RAG應(yīng)用
面向小白的本地部署大模型完整教程:LangChain Streamlit LLama
大模型系列——解讀RAG
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服