從零開始：使用DeepSeek-R1 實(shí)現(xiàn)高效的本地 RAG

2025.02.01

有小伙伴私信我，DeepSeek-R1能用來搭建 RAG（檢索增強(qiáng)生成）系統(tǒng)嗎？答案是絕對可以！

春節(jié)前夕，我們接到了業(yè)務(wù)方的緊急任務(wù)，需要探討如何將 DeepSeek-R1 快速集成到即將上線的項(xiàng)目中。經(jīng)過多次深入討論，我們團(tuán)隊(duì)決定在現(xiàn)有 RAG 系統(tǒng)的一個核心模塊中試用 DeepSeek-R1，替換掉原有的 Qwen 模型。更換完成后，我們對系統(tǒng)進(jìn)行了一系列嚴(yán)格的測試，以確保其穩(wěn)定運(yùn)行。在經(jīng)過徹底驗(yàn)證后，我們成功地在除夕之夜將系統(tǒng)上線。

鑒于所處理數(shù)據(jù)的敏感性，本文將詳盡介紹如何使用DeepSeek-R1、LangChain、Ollama和Streamlit搭建一個本地的、專門處理PDF文件的RAG系統(tǒng)。這套系統(tǒng)利用LangChain的模塊化特點(diǎn)和DeepSeek-R1的隱私保護(hù)能力，非常適合處理技術(shù)文檔、法律文件及學(xué)術(shù)資料等。在后續(xù)的分享中，我將詳細(xì)介紹如何利用 DeepSeek-R1 對系統(tǒng)進(jìn)行Fine-tuning和優(yōu)化的過程。

此項(xiàng)目整合了 LangChain（一種用于 RAG 工作流程的 AI 框架）、Ollama（負(fù)責(zé) DeepSeek-R1 的本地部署）和 Streamlit（提供用戶界面）。最終成品是一個 AI 助手，它能在本地處理 PDF 文件，并以高精確度和速度回答問題。

在此次演示中，我們將使用一個參數(shù)為 7B 的 DeepSeek-R1 精簡模型。但如果你的計算資源更充足，我建議嘗試使用其他版本的 DeepSeek-R1 精簡模型。

為什么選擇本地部署的 RAG 解決方案？

雖然云端 AI 解決方案功能強(qiáng)大，但它們往往涉及到隱私和成本問題。使用 LangChain 的模塊化框架，你可以在本地搭建一個 RAG 系統(tǒng)，這樣做有幾大優(yōu)點(diǎn)：

數(shù)據(jù)隱私：所有的操作都在你自己的設(shè)備上完成，數(shù)據(jù)安全得到保障。
成本效率：避免了昂貴的 API 訂閱費(fèi)用，這個方案不僅免費(fèi)還是開源的。
高度定制化：你可以根據(jù)需要調(diào)整文檔檢索和回答生成的具體流程。
強(qiáng)大的 AI 能力：整合了 DeepSeek-R1，這是一款專為解決復(fù)雜問題和技術(shù)任務(wù)而設(shè)計的模型。

所用工具和技術(shù)：LangChain, DeepSeek-R1, Ollama, ChromaDB 和 Streamlit

這個項(xiàng)目涵蓋了以下幾個部分：

LangChain：這是構(gòu)建 RAG 工作流程的核心框架，支持集成文檔加載、向量存儲和大型語言模型（LLM）。它的模塊化設(shè)計讓你可以根據(jù)具體需求進(jìn)行調(diào)整。
DeepSeek-R1：一種專為編程、問題解決和技術(shù)任務(wù)優(yōu)化的推理型語言模型。它提供了多種本地部署的版本，可通過 Ollama 輕松部署。
Ollama：一個命令行工具，用于簡化本地大型語言模型和嵌入模型（如 DeepSeek-R1 和 mxbai-embed-large）的部署與管理。
ChromaDB：一個向量數(shù)據(jù)庫，能存儲和檢索文檔向量，方便進(jìn)行基于相似性的快速查詢。
Streamlit：一個 Python 庫，用于創(chuàng)建易于操作的 Web 用戶界面，使你的 RAG 應(yīng)用更加用戶友好，易于使用。

構(gòu)建 RAG 工作流：分步指南

以下是如何設(shè)置你的本地 ChatPDF 解決方案：

1. 安裝先決條件

確保你已經(jīng)安裝了 Python 3.8 和Ollama。運(yùn)行以下命令：

curl -fsSL https://ollama.com/install.sh | shollama -v # 驗(yàn)證安裝

下載所需的 AI 模型：

ollama pull deepseek-r1:latest # 默認(rèn) 7B 模型ollama pull mxbai-embed-large  # 嵌入模型

2. 項(xiàng)目設(shè)置

克隆倉庫并設(shè)置虛擬環(huán)境：

git clone https://github.com/paquino11/chatpdf-rag-deepseek-r1.gitcd chatpdf-rag-deepseek-r1python3 -m venv venvsource venv/bin/activate

安裝依賴：

pip install -r requirements.txt

3. 啟動Streamlit

啟動 Streamlit 應(yīng)用：

streamlit run app.py

在瀏覽器中訪問http://localhost:8501。上傳你的 PDF 文件，調(diào)整檢索設(shè)置，開始提問。

使用 DeepSeek-R1、Ollama、LangChain 和 ChromaDB 構(gòu)建 RAG 管道

這個項(xiàng)目我將利用 LangChain 來從零開始搭建的文檔處理流程：

PDF 文件的處理: 利用 LangChain 讀取 PDF 文件，并將其分割成小塊。使用 Ollama 將這些小塊轉(zhuǎn)換成向量形式，便于計算機(jī)理解和處理。
文檔的查找: 通過 ChromaDB 這個工具，快速找到與你問題最相關(guān)的文檔部分。你可以設(shè)置想要查找的結(jié)果數(shù)量和查找的嚴(yán)格程度。
生成回答: DeepSeek-R1 會拿到這些相關(guān)的文檔小塊，然后生成準(zhǔn)確的回答。 LangChain 確保這些回答格式對用戶友好，易于理解。

調(diào)整設(shè)置以獲得更好的結(jié)果

LangChain 允許你輕松調(diào)整設(shè)置，以優(yōu)化搜索結(jié)果：

檢索結(jié)果數(shù)量（k）：這個參數(shù)決定了將使用多少文檔片段來生成答案。如果設(shè)置的數(shù)目較多，可以獲得更全面的答案，但響應(yīng)時間會變慢；如果設(shè)置的數(shù)目較少，響應(yīng)速度會加快，但可能因信息不足而影響答案的全面性。
相似度閾值（score_threshold）：這個參數(shù)用于設(shè)定檢索時的匹配嚴(yán)格度。閾值設(shè)定得高，只有最相關(guān)的文檔片段才會被檢索出來；閾值設(shè)定得低，雖然能檢索到更多的信息，但可能會包括一些相關(guān)性不高的內(nèi)容。

如何使用和測試你的 RAG 應(yīng)用

這里介紹幾種常見的場景，幫助你測試你的應(yīng)用程序：

測試用的 PDF 文件：

金融：分析財務(wù)報告，挖掘出可實(shí)施的商業(yè)見解。
醫(yī)療保健：總結(jié)醫(yī)學(xué)研究論文或指南，提取關(guān)鍵信息。
教育：從電子書和學(xué)術(shù)論文中提取摘要或主要觀點(diǎn)。

示例問題：

“這個 Python 庫的核心功能有哪些？”
“這份合同的第五部分主要討論了什么內(nèi)容？”
“簡要概述這本電子書的第二章。”

結(jié)論

結(jié)合 LangChain、DeepSeek-R1 和 ChromaDB 的使用，你可以構(gòu)建一個重視隱私保護(hù)、靈活性和成本效率的 RAG 系統(tǒng)。這種本地化的解決方案非常適用于分析技術(shù)性文件和法律文件，無需依賴于云服務(wù)。如此一來，你便可以在完全控制數(shù)據(jù)安全的環(huán)境下，有效地處理和分析專業(yè)文檔。

本站僅提供存儲服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊舉報。

打開APP，閱讀全文并永久保存查看更多類似文章

Deepseek R1打造本地化RAG知識庫:安裝部署使用詳細(xì)教程

LlamaIndex ollama 搭建本地RAG應(yīng)用，建立本地知識庫

Deepseek最近那叫一個火，搞得搭建本地知識庫也成熱門事兒了

Chroma Ollama 搭建本地RAG應(yīng)用

面向小白的本地部署大模型完整教程：LangChain Streamlit LLama

大模型系列——解讀RAG

更多類似文章 >>