首先,通過wind或者choice等金融終端把最近一周的行業(yè)研究研報(bào)的搜索結(jié)果導(dǎo)出來,保存為excel格式。
然后,在ChatGPT中輸入提示詞:
F盤有一個(gè)文件:行業(yè)研究報(bào)告20230615.xlsx,其中,D2單元格到D1001單元格是行業(yè)研究報(bào)告的標(biāo)題;
寫一段Python程序,用jieba庫對(duì)D2單元格到D1001單元格的標(biāo)題進(jìn)行文本分析,對(duì)其進(jìn)行分詞,然后提取關(guān)鍵詞,統(tǒng)計(jì)詞頻,輸出結(jié)果到F盤的excel文件:行業(yè)研究報(bào)告關(guān)鍵詞20230615.xlsx
每個(gè)步驟都輸出信息;
這是輸出的結(jié)果,顯然不符合我們預(yù)期的要求。因?yàn)槔锩婧芏酂o意義的關(guān)鍵詞和符號(hào)。這些叫停用詞。
所以,要添加一句提示詞:
注意:去掉停用詞,停用詞詞表在F盤的stopwords.txt;
修改之后,輸出的結(jié)果就比較符合要求了。
可以看到,最近一周,AI、汽車、消費(fèi)、傳媒、新能源等領(lǐng)域是券商研報(bào)關(guān)注的重點(diǎn)方向。
聯(lián)系客服