摸动漫美女奶头的视频,胡歌献唱唐嫣婚礼视频,a一级美女视频

一個厲害的中醫(yī)GPT，AI老中醫(yī)開源了！

xiaosuperman >《人工智能》

2023.06.04 廣東

關(guān)注

大家好，我是 Jack。

大模型 fine-tune，在各個領(lǐng)域百花齊放。

今天介紹一個醫(yī)學(xué)領(lǐng)域 fine-tune 得到的大模型，Huatuo-LLaMA。

我們都知道，OpenAI 最新的 GPT 都沒有開源，自從 FaceBook（Meta）開源了 LLaMA 的預(yù)訓(xùn)練模型之后，基于 LLaMa fine-tune 得到的大模型開始多了起來。

Huatuo-LLaMA 就是其之一，屬于醫(yī)學(xué)領(lǐng)域的模型。

一、Huatuo-LLaMA

我們都知道，LLaMA 有著 7B（70億）到 65B（650億）量級的參數(shù)量。

作者團隊出于訓(xùn)練成本的考慮，選擇了模型參數(shù)量相對較少的 LLaMA-7B 作為 HuaTuo 的基礎(chǔ)模型，在此基礎(chǔ)上進行 instruct tuning，獲得指令微調(diào)的大模型。

基礎(chǔ)模型，就是 Base LLM（Large Language Model），它有著續(xù)寫的能力，比如給一個開頭，Base LLM 能夠根據(jù)提供的開頭續(xù)寫內(nèi)容。

但是 Base LLM 不能理解對話，你問它問題，它不會回答。為了讓大模型具有理解問題的能力，就需要在 Base LLM 的基礎(chǔ)上，進行 instruct tuning，進而得到 Instruction LLM。

好了，Huatuo-LLaMA 大致的訓(xùn)練原理說明白了，它就是一個基于中文的醫(yī)學(xué)數(shù)據(jù)在 LLaMA-7B 開源模型基礎(chǔ)上，instruct tuning 得到的模型。

作者團隊參考 cMeKG，采用公開和自建的中文醫(yī)學(xué)知識庫構(gòu)建訓(xùn)練數(shù)據(jù)。

醫(yī)學(xué)知識庫圍繞疾病、藥物、檢查指標(biāo)等構(gòu)建，字段包括并發(fā)癥，高危因素，組織學(xué)檢查，臨床癥狀，藥物治療，輔助治療等。

知識庫示例如下:

{'中心詞': '偏頭痛', '相關(guān)疾病': ['妊娠合并偏頭痛', '惡寒發(fā)熱'], '相關(guān)癥狀': ['皮膚變硬', '頭部及眼后部疼痛并能聽到連續(xù)不斷的隆隆聲', '晨起頭痛加重'], '所屬科室': ['中西醫(yī)結(jié)合科', '內(nèi)科'], '發(fā)病部位': ['頭部']}

然后利用 GPT3.5 接口圍繞醫(yī)學(xué)知識庫構(gòu)建問答數(shù)據(jù)，豐富 Prompt 的提問形式。

指令微調(diào)的訓(xùn)練集數(shù)據(jù)示例如下：

'問題：一位年輕男性長期使用可卡因，突然出現(xiàn)胸痛、嘔吐、出汗等癥狀，經(jīng)檢查發(fā)現(xiàn)心電圖反映心肌急性損傷，請問可能患的是什么疾??？治療方式是什么？'
'回答: 可能患的是心肌梗塞，需要進行維拉帕米、依普利酮、硝酸甘油、?阻滯劑、嗎啡等藥物治療，并進行溶栓治療、低分子量肝素、鈣通道阻滯劑等輔助治療。此外需要及時停用可卡因等藥物，以防止病情加重。'

這個數(shù)據(jù)就構(gòu)建好了。

然后利用 LLaMa 開源的 finetune 代碼，就能進行訓(xùn)練了。

#!/bin/bash

exp_tag='e1'
python finetune.py \
    --base_model 'decapoda-research/llama-7b-hf' \
    --data_path './data/llama_data.json' \
    --output_dir './lora-llama-med-'$exp_tag \
    --prompt_template_name 'med_template' \
    --micro_batch_size 128 \
    --batch_size 128 \
    --wandb_run_name $exp_tag