數(shù)據(jù)挖掘人員需具備以下基本條件,才可以完成數(shù)據(jù)挖掘項(xiàng)目中的相關(guān)任務(wù)。
一、專業(yè)技能
碩士以上學(xué)歷,數(shù)據(jù)挖掘、統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)相關(guān)專業(yè),熟練掌握關(guān)系數(shù)據(jù)庫(kù)技術(shù),具有數(shù)據(jù)庫(kù)系統(tǒng)開(kāi)發(fā)經(jīng)驗(yàn)
熟練掌握常用的數(shù)據(jù)挖掘算法
具備數(shù)理統(tǒng)計(jì)理論基礎(chǔ),并熟悉常用的統(tǒng)計(jì)工具軟件
二、行業(yè)知識(shí)
具有相關(guān)的行業(yè)知識(shí),或者能夠很快熟悉相關(guān)的行業(yè)知識(shí)
三、合作精神
具有良好的團(tuán)隊(duì)合作精神,能夠主動(dòng)和項(xiàng)目中其他成員緊密合作
四、客戶關(guān)系能力
具有良好的客戶溝通能力,能夠明確闡述數(shù)據(jù)挖掘項(xiàng)目的重點(diǎn)和難點(diǎn),善于調(diào)整客戶對(duì)數(shù)據(jù)挖掘的誤解和過(guò)高期望
具有良好的知識(shí)轉(zhuǎn)移能力,能夠盡快地讓模型維護(hù)人員了解并掌握數(shù)據(jù)挖掘方法論及建模實(shí)施能力
進(jìn)階能力要求
數(shù)據(jù)挖掘人員具備如下條件,可以提高數(shù)據(jù)挖掘項(xiàng)目的實(shí)施效率,縮短項(xiàng)目周期。
具有數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目實(shí)施經(jīng)驗(yàn),熟悉數(shù)據(jù)倉(cāng)庫(kù)技術(shù)及方法論
熟練掌握SQL語(yǔ)言,包括復(fù)雜查詢、性能調(diào)優(yōu)
熟練掌握ETL開(kāi)發(fā)工具和技術(shù)
熟練掌握Microsoft Office軟件,包括Excel和PowerPoint中的各種統(tǒng)計(jì)圖形技術(shù)
善于將挖掘結(jié)果和客戶的業(yè)務(wù)管理相結(jié)合,根據(jù)數(shù)據(jù)挖掘的成果向客戶提供有價(jià)值的可行性操作方案
應(yīng)用及就業(yè)領(lǐng)域
當(dāng)前數(shù)據(jù)挖掘應(yīng)用主要集中在電信(客戶分析),零售(銷售預(yù)測(cè)),農(nóng)業(yè)(行業(yè)數(shù)據(jù)預(yù)測(cè)),網(wǎng)絡(luò)日志(網(wǎng)頁(yè)定制),銀行(客戶欺詐),電力(客戶呼叫),生物(基因),天體(星體分類),化工,醫(yī)藥等方面。當(dāng)前它能解決的問(wèn)題典型在于:數(shù)據(jù)庫(kù)營(yíng)銷(Database Marketing)、客戶群體劃分(Customer Segmentation & Classification)、背景分析(Profile Analysis)、交叉銷售(Cross-selling)等市場(chǎng)分析行為,以及客戶流失性分析(Churn Analysis)、客戶信用記分(Credit Scoring)、欺詐發(fā)現(xiàn)(Fraud Detection)等等,在許多領(lǐng)域得到了成功的應(yīng)用。如果你訪問(wèn)著名的亞馬遜網(wǎng)上書店(
www.amazon.com),會(huì)發(fā)現(xiàn)當(dāng)你選中一本書后,會(huì)出現(xiàn)相關(guān)的推薦數(shù)目“Customers who bought this book also bought”,這背后就是數(shù)據(jù)挖掘技術(shù)在發(fā)揮作用。
數(shù)據(jù)挖掘的對(duì)象是某一專業(yè)領(lǐng)域中積累的數(shù)據(jù);挖掘過(guò)程是一個(gè)人機(jī)交互、多次反復(fù)的過(guò)程;挖掘的結(jié)果要應(yīng)用于該專業(yè)。因此數(shù)據(jù)挖掘的整個(gè)過(guò)程都離不開(kāi)應(yīng)用領(lǐng)域的專業(yè)知識(shí)。“Business First, technique second”是數(shù)據(jù)挖掘的特點(diǎn)。因此學(xué)習(xí)數(shù)據(jù)挖掘不意味著丟棄原有專業(yè)知識(shí)和經(jīng)驗(yàn)。相反,有其它行業(yè)背景是從事數(shù)據(jù)挖掘的一大優(yōu)勢(shì)。如有銷售,財(cái)務(wù),機(jī)械,制造,call center等工作經(jīng)驗(yàn)的,通過(guò)學(xué)習(xí)數(shù)據(jù)挖掘,可以提升個(gè)人職業(yè)層次,在不改變?cè)瓕I(yè)的情況下,從原來(lái)的事務(wù)型角色向分析型角色轉(zhuǎn)變。從80年代末的初露頭角到90年代末的廣泛應(yīng)用,以數(shù)據(jù)挖掘?yàn)楹诵牡纳虡I(yè)智能(BI)已經(jīng)成為IT及其它行業(yè)中的一個(gè)新寵。
數(shù)據(jù)采集分析專員
職位介紹:數(shù)據(jù)采集分析專員的主要職責(zé)是把公司運(yùn)營(yíng)的數(shù)據(jù)收集起來(lái),再?gòu)闹型诰虺鲆?guī)律性的信息來(lái)指導(dǎo)公司的戰(zhàn)略方向。這個(gè)職位常被忽略,但相當(dāng)重要。由于數(shù)據(jù)庫(kù)技術(shù)最先出現(xiàn)于計(jì)算機(jī)領(lǐng)域,同時(shí)計(jì)算機(jī)數(shù)據(jù)庫(kù)具有海量存儲(chǔ)、查找迅速、分析半自動(dòng)化等特點(diǎn),數(shù)據(jù)采集分析專員最先出現(xiàn)于計(jì)算機(jī)行業(yè),后來(lái)隨著計(jì)算機(jī)應(yīng)用的普及擴(kuò)展到了各個(gè)行業(yè)。該職位一般提供給懂?dāng)?shù)據(jù)庫(kù)應(yīng)用和具有一定統(tǒng)計(jì)分析能力的人。有計(jì)算機(jī)特長(zhǎng)的統(tǒng)計(jì)專業(yè)人員,或?qū)W過(guò)數(shù)據(jù)挖掘的計(jì)算機(jī)專業(yè)人員都可以勝任此工作,不過(guò)最好能夠?qū)λ谛袠I(yè)的市場(chǎng)情況具有一定的了解。
求職建議:由于很多公司追求短期利益而不注重長(zhǎng)期戰(zhàn)略的現(xiàn)狀,目前國(guó)內(nèi)很多企業(yè)對(duì)此職位的重視程度不夠。但大型公司、外企對(duì)此職位的重視程度較高,隨著時(shí)間的推移該職位會(huì)有升溫的趨勢(shì)。另外,數(shù)據(jù)采集分析專員很容易獲得行業(yè)經(jīng)驗(yàn),他們?cè)诜治鲞^(guò)程中能夠很輕易地把握該行業(yè)的市場(chǎng)情況、客戶習(xí)慣、渠道分布等關(guān)鍵情況,因此如果想在某行創(chuàng)業(yè),從數(shù)據(jù)采集分析專員干起是一個(gè)不錯(cuò)的選擇。
市場(chǎng)/數(shù)據(jù)分析師
1. 市場(chǎng)數(shù)據(jù)分析是現(xiàn)代市場(chǎng)營(yíng)銷科學(xué)必不可少的關(guān)鍵環(huán)節(jié): Marketing/Data Analyst從業(yè)最多的行業(yè): Direct Marketing (直接面向客戶的市場(chǎng)營(yíng)銷) 吧,自90年代以來(lái), Direct Marketing越來(lái)越成為公司推銷其產(chǎn)品的主要手段。根據(jù)加拿大市場(chǎng)營(yíng)銷組織(Canadian Marketing Association)的統(tǒng)計(jì)數(shù)據(jù): 僅1999年一年 Direct Marketing就創(chuàng)造了470000 個(gè)工作機(jī)會(huì)。從1999至2000,工作職位又增加了30000個(gè)。為什么Direct Marketing需要這么多Analyst呢? 舉個(gè)例子, 隨著商業(yè)競(jìng)爭(zhēng)日益加劇,公司希望能最大限度的從廣告中得到銷售回報(bào), 他們希望能有更多的用戶來(lái)響應(yīng)他們的廣告。所以他們就必需要在投放廣告之前做大量的市場(chǎng)分析工作。例如,根據(jù)自己的產(chǎn)品結(jié)合目標(biāo)市場(chǎng)顧客的家庭收入,教育背景和消費(fèi)趨向分析出哪些地區(qū)的住戶或居民最有可能響應(yīng)公司的銷售廣告,購(gòu)買自己的產(chǎn)品或成為客戶,從而廣告只針對(duì)這些特定的客戶群。這樣有的放矢的篩選廣告的投放市場(chǎng)既節(jié)省開(kāi)銷又提高了銷售回報(bào)率。但是所有的這些分析都是基于數(shù)據(jù)庫(kù),通過(guò)數(shù)據(jù)處理,挖掘,建模得出的,其間,市場(chǎng)分析師的工作是必不可少的。
2. 行業(yè)適應(yīng)性強(qiáng): 幾乎所有的行業(yè)都會(huì)應(yīng)用到數(shù)據(jù), 所以作為一名數(shù)據(jù)/市場(chǎng)分析師不僅僅可以在華人傳統(tǒng)的IT行業(yè)就業(yè),也可以在政府,銀行,零售,醫(yī)藥業(yè),制造業(yè)和交通傳輸?shù)阮I(lǐng)域服務(wù)。
現(xiàn)狀與前景
數(shù)據(jù)挖掘是適應(yīng)信息社會(huì)從海量的數(shù)據(jù)庫(kù)中提取信息的需要而產(chǎn)生的新學(xué)科。它是統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)、模式識(shí)別、人工智能等學(xué)科的交叉。在中國(guó)各重點(diǎn)院校中都已經(jīng)開(kāi)了數(shù)據(jù)挖掘的課程或研究課題。比較著名的有中科院計(jì)算所、復(fù)旦大學(xué)、清華大學(xué)等。另外,政府機(jī)構(gòu)和大型企業(yè)也開(kāi)始重視這個(gè)領(lǐng)域。
據(jù)IDC對(duì)歐洲和北美62家采用了商務(wù)智能技術(shù)的企業(yè)的調(diào)查分析發(fā)現(xiàn),這些企業(yè)的3年平均投資回報(bào)率為401%,其中25%的企業(yè)的投資回報(bào)率超過(guò)600%。調(diào)查結(jié)果還顯示,一個(gè)企業(yè)要想在復(fù)雜的環(huán)境中獲得成功,高層管理者必須能夠控制極其復(fù)雜的商業(yè)結(jié)構(gòu),若沒(méi)有詳實(shí)的事實(shí)和數(shù)據(jù)支持,是很難辦到的。因此,隨著數(shù)據(jù)挖掘技術(shù)的不斷改進(jìn)和日益成熟,它必將被更多的用戶采用,使更多的管理者得到更多的商務(wù)智能。
根據(jù)IDC(International Data Corporation)預(yù)測(cè)說(shuō)2004年估計(jì)BI行業(yè)市場(chǎng)在140億美元?,F(xiàn)在,隨著我國(guó)加入WTO,我國(guó)在許多領(lǐng)域,如金融、保險(xiǎn)等領(lǐng)域?qū)⒅鸩綄?duì)外開(kāi)放,這就意味著許多企業(yè)將面臨來(lái)自國(guó)際大型跨國(guó)公司的巨大競(jìng)爭(zhēng)壓力。國(guó)外發(fā)達(dá)國(guó)家各種企業(yè)采用商務(wù)智能的水平已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了我國(guó)。美國(guó)Palo Alto 管理集團(tuán)公司1999年對(duì)歐洲、北美和日本375家大中型企業(yè)的商務(wù)智能技術(shù)的采用情況進(jìn)行了調(diào)查。結(jié)果顯示,在金融領(lǐng)域,商務(wù)智能技術(shù)的應(yīng)用水平已經(jīng)達(dá)到或接近70%,在營(yíng)銷領(lǐng)域也達(dá)到50%,并且在未來(lái)的3年中,各個(gè)應(yīng)用領(lǐng)域?qū)υ摷夹g(shù)的采納水平都將提高約50%。
現(xiàn)在,許多企業(yè)都把數(shù)據(jù)看成寶貴的財(cái)富,紛紛利用商務(wù)智能發(fā)現(xiàn)其中隱藏的信息,借此獲得巨額的回報(bào)。國(guó)內(nèi)暫時(shí)還沒(méi)有官方關(guān)于數(shù)據(jù)挖掘行業(yè)本身的市場(chǎng)統(tǒng)計(jì)分析報(bào)告,但是國(guó)內(nèi)數(shù)據(jù)挖掘在各個(gè)行業(yè)都有一定的研究。據(jù)國(guó)外專家預(yù)測(cè),在今后的5—10年內(nèi),隨著數(shù)據(jù)量的日益積累以及計(jì)算機(jī)的廣泛應(yīng)用,數(shù)據(jù)挖掘?qū)⒃谥袊?guó)形成一個(gè)產(chǎn)業(yè)。
眾所周知,IT就業(yè)市場(chǎng)競(jìng)爭(zhēng)已經(jīng)相當(dāng)激烈,而數(shù)據(jù)處理的核心技術(shù)---數(shù)據(jù)挖掘更是得到了前所未有的重視。數(shù)據(jù)挖掘和商業(yè)智能技術(shù)位于整個(gè)企業(yè)IT-業(yè)務(wù)構(gòu)架的金字塔塔尖,目前國(guó)內(nèi)數(shù)據(jù)挖掘?qū)I(yè)的人才培養(yǎng)體系尚不健全,人才市場(chǎng)上精通數(shù)據(jù)挖掘技術(shù)、商業(yè)智能的供應(yīng)量極小,而另一方面企業(yè)、政府機(jī)構(gòu)和和科研單位對(duì)此類人才的潛在需求量極大,供需缺口極大。如果能將數(shù)據(jù)挖掘技術(shù)與個(gè)人已有專業(yè)知識(shí)相結(jié)合,您必將開(kāi)辟職業(yè)生涯的新天地!
職業(yè)薪酬
就目前來(lái)看,和大多IT業(yè)的職位一樣,數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘方面的人才在國(guó)內(nèi)的需求工作也是低端飽和,高端緊缺,在二線成熟,高端數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘方面的人才尤其稀少。高端數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘人才需要熟悉多個(gè)行業(yè),至少有3年以上大型DWH和BI經(jīng)驗(yàn),英語(yǔ)讀寫流利,具有項(xiàng)目推動(dòng)能力,這樣的人才年薪能達(dá)到20萬(wàn)以上。
職業(yè)認(rèn)證
1、SAS認(rèn)證的應(yīng)用行業(yè)及職業(yè)前景
SAS全球?qū)I(yè)認(rèn)證是國(guó)際上公認(rèn)的數(shù)據(jù)挖掘和商業(yè)智能領(lǐng)域的權(quán)威認(rèn)證,隨著我國(guó)IT環(huán)境和應(yīng)用的日漸成熟,以上兩個(gè)領(lǐng)域?qū)⒂袠O大的行業(yè)發(fā)展空間。獲取SAS全球?qū)I(yè)認(rèn)證,為您在數(shù)據(jù)挖掘、分析方法論領(lǐng)域積累豐富經(jīng)驗(yàn)奠定良好的基礎(chǔ),幫助您開(kāi)辟職業(yè)發(fā)展的新天地。
2、SAS認(rèn)證的有效期
目前SAS五級(jí)認(rèn)證沒(méi)有特定有效期,但是時(shí)間太久或版本太老的認(rèn)證證書會(huì)有所貶值。
3、五級(jí)認(rèn)證的關(guān)系
五級(jí)認(rèn)證為遞進(jìn)式關(guān)系,即只有通過(guò)上一級(jí)考試科目才能參加下一級(jí)認(rèn)證考試。
4、SAS全球認(rèn)證的考試方式
考試為上機(jī)考試,時(shí)間2個(gè)小時(shí),共70道客觀題。
相關(guān)鏈接
隨著中國(guó)物流行業(yè)的整體快速發(fā)展,物流信息化建設(shè)也取得一定進(jìn)展。無(wú)論在IT硬件市場(chǎng)、軟件市場(chǎng)還是信息服務(wù)市場(chǎng),物流行業(yè)都具有了一定的投資規(guī)模,近兩年的總投資額均在20-30億元之間。政府對(duì)現(xiàn)代物流業(yè)發(fā)展的積極支持、物流市場(chǎng)競(jìng)爭(zhēng)的加劇等因素有力地促進(jìn)了物流信息化建設(shè)的穩(wěn)步發(fā)展。
易觀國(guó)際最新報(bào)告《中國(guó)物流行業(yè)信息化年度綜合報(bào)告2006》中指出,中國(guó)物流業(yè)正在從傳統(tǒng)模式向現(xiàn)代模式實(shí)現(xiàn)整體轉(zhuǎn)變,現(xiàn)代物流模式將引導(dǎo)物流業(yè)信息化需求,而產(chǎn)生這種轉(zhuǎn)變的基本動(dòng)力來(lái)自市場(chǎng)需求。報(bào)告中的數(shù)據(jù)顯示:2006-2010年,傳統(tǒng)物流企業(yè)IT投入規(guī)模將累計(jì)超過(guò)100億元人民幣。2006-2010年,第三方物流企業(yè)IT投入規(guī)模將累計(jì)超過(guò)20億元人民幣。
由于目前行業(yè)應(yīng)用軟件系統(tǒng)在作業(yè)層面對(duì)終端設(shè)備的硬件提出的應(yīng)用要求較高,而軟件與硬件的集成性普遍不理想,對(duì)應(yīng)性單一,因此企業(yè)將對(duì)軟件硬件設(shè)備的集成提出更高要求。
物流行業(yè)軟件系統(tǒng)研發(fā)將更多的考慮運(yùn)籌學(xué)與數(shù)據(jù)挖掘技術(shù),專業(yè)的服務(wù)商將更有利于幫助解決研發(fā)問(wèn)題。
物流科學(xué)的理論基礎(chǔ)來(lái)源于運(yùn)籌學(xué),并且非常強(qiáng)調(diào)在繁雜的數(shù)據(jù)處理中找到關(guān)聯(lián)關(guān)系(基于成本-服務(wù)水平體系),因此數(shù)據(jù)挖掘技術(shù)對(duì)于相關(guān)的軟件系統(tǒng)顯得更為重。
本文來(lái)自: 人大經(jīng)濟(jì)論壇 數(shù)據(jù)挖掘中心 版,詳細(xì)出處參考:
http://www.pinggu.org/bbs/viewthread.php?tid=477011&page=1