◆ ◆ ◆ ◆
小編之前有個同事,有一天突然宣布辭職,高薪跳槽到一家互聯(lián)網(wǎng)公司從事數(shù)據(jù)挖掘工作,驚得小編下巴都要掉了。小編第一次聽到數(shù)據(jù)挖掘,就像第一次讀到《鬼吹燈》盜墓小說那種神秘感。不過,數(shù)據(jù)挖掘可能沒那么高深,也沒那么不可觸摸。有了統(tǒng)計工具,再加上操作方法,你也能做數(shù)據(jù)挖掘。這不,這么一門課程來啦,想成為數(shù)據(jù)挖掘高手的你,趕緊行動吧。
如果你是傳統(tǒng)市場研究、社會統(tǒng)計領(lǐng)域中的初級從業(yè)者或者學(xué)生,或許會為這些問題感到困擾:
如何做研究設(shè)計;
如何設(shè)計數(shù)據(jù)收集方法;
收集回來的數(shù)據(jù)如何分析。
本次課程旨在數(shù)據(jù)挖掘流程、傳統(tǒng)常用挖掘算法的原理和軟件操作的培訓(xùn)。以實際案例數(shù)據(jù)為基礎(chǔ),講解如何從數(shù)據(jù)預(yù)處理、挑選合適算法,直到模型檢驗,形成可行的分析結(jié)論。
錢兵,中國電信北京研究院云計算與大數(shù)據(jù)研究經(jīng)理,CDA 二級數(shù)學(xué)建模師。
工作經(jīng)歷:從事數(shù)據(jù)分析和數(shù)據(jù)挖掘的工作近7年,從2010 年陸續(xù)通過網(wǎng)絡(luò)遠(yuǎn)程語音和面授有上百次教學(xué)經(jīng)驗。3年傳統(tǒng)市場研究經(jīng)驗,2年大數(shù)據(jù)領(lǐng)域工作,主要覆蓋消費者購買路徑、商業(yè)地理洞察、廣告效果評估等研究。
數(shù)據(jù)分析領(lǐng)域相關(guān)獲獎經(jīng)歷:第十三屆中國市場研究“寶潔論文獎”專業(yè)組一等獎、第十五屆、十一屆中國市場研究“寶潔論文獎”專業(yè)組三等獎、第八屆全國研究生數(shù)學(xué)建模競賽全國一等獎、第七屆全國研究生數(shù)學(xué)建模競賽全國二等獎、2008年中國大學(xué)生數(shù)學(xué)建模競賽全國二等獎、2007 年中國大學(xué)生數(shù)學(xué)建模競賽湖北省二等獎。
擅長軟件:SPSS、SAS、SPSSModeler、AMOS、Weka、ucinet、matlab、lingo、Tagxedo
1、無數(shù)理基礎(chǔ),但有較強數(shù)據(jù)分析挖掘興趣的學(xué)生或從業(yè)人員;
2、有一定數(shù)理統(tǒng)計基礎(chǔ)的學(xué)生或從業(yè)人員。
第一講數(shù)據(jù)預(yù)處理及基礎(chǔ)挖掘算法1(1月21日上午9:30-12:30)
1. 字段選擇
2. 數(shù)據(jù)清洗
3. 字段擴充
4. 數(shù)據(jù)編碼
5. KNN 算法(KNearest Neighbors)
第二講基礎(chǔ)挖掘算法 2(1月21日下午14:30-17:30)
1. 訓(xùn)練和測試樣本數(shù)據(jù)的選取
2. 進(jìn)入模型的變量篩選
3. 決策樹(ID3、C5.0、CART、CHAID)
4. 回歸分析(線性、非線性、Logistic 回歸、時間序列分析)
第三講進(jìn)階挖掘算法 1(1月22日上午9:30-12:30)
1. 關(guān)聯(lián)規(guī)則(支持度、信賴度、提升度及 Apriori算法)
2. 聚類分析(階層式聚類、分割式聚類)
3. 神經(jīng)網(wǎng)絡(luò)
第四講進(jìn)階挖掘算法2(1月22日下午14:30-17:30)
1. 支持向量機
2. 集成算法(Bagging、Boosting、Random Forest)
3. 模型評估(混亂矩陣(正確率、響應(yīng)率、捕捉率、F-指標(biāo))、ROC 曲線、GINI 圖)
培訓(xùn)形式:知深平臺直播
報名截止:2017年1月20日17:00
課程費用:426元/人
培訓(xùn)時間:1月21日和1月22日
詳情請咨詢:學(xué)長微信(xueshuxuezhang)
1.學(xué)術(shù)中國研習(xí)營會員免費,單獨找學(xué)長(微信ID:xueshuxuezhang)報名;多說一句,研習(xí)營會員采用分批招募,招募時間會以公告的形式發(fā)布,請各位學(xué)友多多關(guān)注學(xué)術(shù)中國和知深平臺了解會員招募信息。