今天來(lái)講講,本地部署DeepSeek一個(gè)重要應(yīng)用場(chǎng)景:搭建AI知識(shí)庫(kù)。好處1:數(shù)據(jù)在本地電腦上,保護(hù)數(shù)據(jù)安全和個(gè)人隱私,對(duì)于企業(yè)來(lái)說(shuō)尤為重要。好處2:通用大模型(比如ChatGPT)缺少垂直領(lǐng)域的知識(shí),每次前提問(wèn)都需要提供背景信息,上傳相關(guān)資料,才可以得到相對(duì)高質(zhì)量回答。而本地模型+知識(shí)庫(kù)的模式,簡(jiǎn)單的提問(wèn)就可以很容易得到垂直定制化,且精準(zhǔn)的高質(zhì)量回答。好處3:使用時(shí)間越長(zhǎng),知識(shí)庫(kù)越豐富,回答質(zhì)量越高,形成正循環(huán)。好處4:不需要聯(lián)網(wǎng),即使官方宕機(jī)甚至斷網(wǎng)也能正常使用。Dify是一個(gè)快速搭建AI應(yīng)用的項(xiàng)目,支持創(chuàng)建AI聊天機(jī)器人、自動(dòng)化客服等。本篇主要講解如何用Dify搭建私人化知識(shí)庫(kù)。本地找一個(gè)不含中文的目錄,進(jìn)入CMD窗口,執(zhí)行命令,下載Dify項(xiàng)目。git clone https://github.com/langgenius/dify
cd dify/docker
# .env.example復(fù)制,并重命名為 .env
copy .env.example .env
.env是dify的配置文件,保持默認(rèn)配置就好了。啟動(dòng)docker,執(zhí)行命令運(yùn)行dify。項(xiàng)目啟動(dòng)以后,瀏覽器訪問(wèn):http://127.0.0.1/apps/首次進(jìn)入需要設(shè)置管理員賬號(hào),并且登錄進(jìn)入系統(tǒng)。分為2個(gè)步驟:添加模型和添加知識(shí)庫(kù)。頁(yè)面右上角頭像 -> 設(shè)置 -> 模型供應(yīng)商,下拉找到Ollama,【添加模型】。模型類型:LLM
模型名稱:deepseek-r1:7b (根據(jù)電腦配置選擇1.5b/7b/8b/32b等)
基礎(chǔ)URL:http://host.docker.internal:11434
配置向量化模型【Nomic-Embed-Text】,它具備強(qiáng)大的長(zhǎng)上下文處理能力。下載命令:ollama pull nomic-embed-text
同樣的方式,在Ollama下添加模型,參數(shù)如下:模型類型:Text Embedding
模型名稱:nomic-embed-text:latest
基礎(chǔ)URL:http://host.docker.internal:11434
保存以后,即可完成2個(gè)模型的添加。
結(jié)果如下圖:
配置2個(gè)大模型以后,開(kāi)始配置【知識(shí)庫(kù)】。回到首頁(yè),切換到【知識(shí)庫(kù)】菜單,創(chuàng)建知識(shí)庫(kù)。數(shù)據(jù)源有3種:導(dǎo)入已有文件、同步自Notion內(nèi)容、同步自Web內(nèi)容。這次搭建的是本地離線知識(shí)庫(kù),選第1個(gè),導(dǎo)入準(zhǔn)備好的知識(shí)庫(kù)材料,【下一步】。檢索設(shè)置選【混合檢索】,其他參數(shù)不變,保存并處理。稍等一會(huì),知識(shí)庫(kù)就設(shè)置完成了。回到首頁(yè),切換到【工作室】菜單,點(diǎn)擊【創(chuàng)建空白應(yīng)用】。應(yīng)用類型選【聊天助手】,應(yīng)用名稱和圖標(biāo),根據(jù)自己需要填寫。點(diǎn)擊【創(chuàng)建】,下方的上下文欄,就是設(shè)置知識(shí)庫(kù)的地方。點(diǎn)【添加】,在彈窗上,選擇剛剛創(chuàng)建的知識(shí)庫(kù)。設(shè)置完成以后,就可以發(fā)布使用了。右上角【發(fā)布】-> 【更新】-> 【運(yùn)行】。運(yùn)行以后,頁(yè)面自動(dòng)跳轉(zhuǎn)到對(duì)話頁(yè)面,一個(gè)自帶知識(shí)庫(kù)的AI聊天助手就完成啦。大模型有一個(gè)特點(diǎn):沒(méi)有自我意識(shí),對(duì)自己不了解。提一個(gè)問(wèn)題:what is DeepSeek V3?官方的回答就非常簡(jiǎn)單,而包含DeepSeek V3論文知識(shí)庫(kù)的本地模型,它的回答就非常準(zhǔn)確詳細(xì),即使這個(gè)問(wèn)題很簡(jiǎn)單,不聯(lián)網(wǎng)搜索。