主要介紹用DeepSeek快速搭建個人知識庫,附詳細(xì)教程。關(guān)鍵詞:DeepSeek、知識庫、向量、嵌入模型
為什么你需要一個個人知識庫?
在日常工作和學(xué)習(xí)中,我們常常會積累大量的文檔、代碼、筆記等資料。如果沒有一個統(tǒng)一的存儲和檢索系統(tǒng),這些資料很容易變得雜亂無章,查找起來費(fèi)時費(fèi)力。
別慌,這次我們用DeepSeek快速搭建自己的個人知識庫,實現(xiàn)本地上傳文檔,量化成知識庫,通過智能助手快速回復(fù)。
主要目的:
上一篇 《3分鐘搞定DeepSeek本地化安裝部署,小白也能看懂!》主要介紹DeepSeek本地化部署,說實在的,個人電腦16GB內(nèi)存+10G GPU. 運(yùn)行14b 大模型,還是相當(dāng)卡。因此搭建知識庫時不建議本地化部署。當(dāng)然個人為了數(shù)據(jù)安全,可以選擇。
本文主要介紹,網(wǎng)頁版DeepSeek搭建知識庫。
https://cherry-ai.com/download.html
如果存在報錯,我將對應(yīng)的安裝包放在了網(wǎng)盤中,可以直接取網(wǎng)盤下載。
無腦安裝,比較簡單,這里不在贅述。
官網(wǎng)介紹了MacOs版本的教程,
詳細(xì)步驟可參考:https://docs.cherry-ai.com/advanced-basic/knowledge-base
為方便讀者使用,這里作者給出Windows版本的詳細(xì)教程。
實現(xiàn)步驟
1、添加對話模型
2、登錄/注冊「硅基流動」
登錄地址:https://cloud.siliconflow.cn/
新用戶注冊即送2000萬Tokens。如果你是新用戶不需要購買,直接按照教程操作
3、點擊此處,生成API秘鑰
可直接跳轉(zhuǎn)到和1登錄/注冊「硅基流動」的地址,先登錄注冊(如果操作了1 請忽略)
4、生成并復(fù)制 API秘鑰
5、配置API秘鑰
回到Cherry Studio,配置API秘鑰,點擊右側(cè)檢查,選擇對應(yīng)模型
注意:最好檢查一下,要不后邊報錯連接失敗
現(xiàn)在有了R1會話模型,我們需要添加一個嵌入模型。
說明:對話模型和嵌入模型的區(qū)別?
對話模型就是能和人聊天的模型。
比如你問一個聊天機(jī)器人“今天天氣怎么樣?”它會回答“今天天氣很好,適合出門。”它的任務(wù)就是根據(jù)你的問題,生成一個合適的回答。
嵌入模型是把文字變成數(shù)字向量的模型。這是生成知識庫的內(nèi)核
例子:比如“蘋果”這個詞,嵌入模型會把它變成一個數(shù)字向量,比如 [0.1, 0.2, 0.3]。如果“蘋果”和“水果”語義相近,它們的向量也會很接近,比如 [0.1, 0.2, 0.3] 和 [0.12, 0.21, 0.31]。這樣,計算機(jī)就可以通過向量來理解它們的關(guān)系。
6、添加嵌入模型
我們使用免費(fèi)的BAAI/bge-m3測試使用
添加一個嵌入模型
這個不需要API秘鑰。
現(xiàn)在有了我們選擇的嵌入模型,接下來創(chuàng)建知識庫。
7、新建知識庫
8、添加文件并向量化
9、添加助手并配置對應(yīng)模型
10、對話中引用知識庫生成回復(fù)
11、驗證效果
可以看到和本地文檔中的內(nèi)容一樣
你的 轉(zhuǎn)發(fā)
和點贊
,就仿佛世界人民都在看
。
<<< END >>>
文字丨微微一笑
(源于新技術(shù)的探索)
芝蘭生于幽谷,不以無人而不芳