許多成功的企業(yè)都發(fā)現(xiàn)了圍繞著數(shù)據(jù)挖掘而產(chǎn)生的神話確實(shí)就是誤解。這些企業(yè)沒(méi)有成為這些誤區(qū)的犧牲品,而是通過(guò)使用數(shù)據(jù)挖掘技術(shù)解決復(fù)雜的業(yè)務(wù)問(wèn)題來(lái)增加利潤(rùn),獲取更大的競(jìng)爭(zhēng)優(yōu)勢(shì)。
實(shí)際上正是復(fù)雜的數(shù)據(jù)挖掘技術(shù)使得鄉(xiāng)村地區(qū)的Wal-Mart超市連鎖店決定在秋季準(zhǔn)備大量某種廣告郵件 。雖然可笑,但Spamouflage-經(jīng)過(guò)巧妙包裝的廣告郵件已經(jīng)取得了極大的成功。不單單是一個(gè)可愛的想法,Spamouflage幫助Wal-Mart從現(xiàn)有的顧客群中獲得了額外的利潤(rùn),并且也顯示了Wal-Mart是多么深刻地理解著他們所服務(wù)的人群。
數(shù)據(jù)挖掘到底是什么?
數(shù)據(jù)挖掘是一種非常有力的分析工具,它可以幫助企業(yè)主管們通過(guò)了解顧客的歷史行為的信息來(lái)預(yù)測(cè)他們將來(lái)的行為。它找到了解開顧客行為秘密的模式。這些發(fā)現(xiàn)可被用于創(chuàng)造利潤(rùn),縮減成本,以及抓住商業(yè)機(jī)會(huì),獲得新的競(jìng)爭(zhēng)優(yōu)勢(shì)。
關(guān)于數(shù)據(jù)挖掘所產(chǎn)生的誤解的部分原因是人們并不十分了解它究竟是什么。從最本質(zhì)上講,數(shù)據(jù)挖掘就是一套用于發(fā)現(xiàn)和解釋詳細(xì)數(shù)據(jù)的未知模式的復(fù)雜的數(shù)學(xué)技術(shù)。自從80年代中期以來(lái),數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域從學(xué)術(shù)、醫(yī)藥、科學(xué)研究領(lǐng)域擴(kuò)展開來(lái),已被非常有效地應(yīng)用在零售、銀行、電信、保險(xiǎn)、旅行和服務(wù)行業(yè)。
因?yàn)閿?shù)據(jù)挖掘被認(rèn)為是一種分析工具,它經(jīng)常與在線分析處理(OLAP)相混淆。OLAP是一種有價(jià)值的分析技術(shù),它被用于分析業(yè)務(wù)操作來(lái)對(duì)已發(fā)生的事情做出歷史性的回顧。例如,一位市場(chǎng)部經(jīng)理想要了解為什么某個(gè)地區(qū)的銷售額下滑了。OLAP工具可以幫助他從各個(gè)不同的方面提出問(wèn)題,例如以商店統(tǒng)計(jì)的銷售額、以產(chǎn)品統(tǒng)計(jì)的銷售額和一段時(shí)間內(nèi)的銷售額。通過(guò)從不同的角度觀察這些歷史數(shù)據(jù),他就會(huì)分析出對(duì)銷售額產(chǎn)生影響的因素(商店、產(chǎn)品,或是時(shí)間)。
數(shù)據(jù)挖掘則處理另一類問(wèn)題。它可被用于預(yù)測(cè)未來(lái)事件,例如,基于促銷情況或者哪類顧客最有可能對(duì)促銷感興趣來(lái)預(yù)測(cè)下個(gè)月的銷售額。
一些企業(yè)使用數(shù)據(jù)挖掘的方式消除了關(guān)于數(shù)據(jù)挖掘的5個(gè)誤區(qū)。
誤區(qū)1:數(shù)據(jù)挖掘提供了即時(shí)的未來(lái)預(yù)測(cè)
數(shù)據(jù)挖掘既不是水晶球也不是一按按鈕就能魔術(shù)般出現(xiàn)答案的技術(shù)。它是一個(gè)多步驟的處理過(guò)程,其中包括:定義業(yè)務(wù)問(wèn)題,掃描并按條件搜索數(shù)據(jù),開發(fā)模型,運(yùn)用獲得的知識(shí)。典型情況是,企業(yè)花費(fèi)大量時(shí)間預(yù)處理并且按照條件搜索數(shù)據(jù),保證其干凈、一致、良好整合,以便于應(yīng)用他們所需要的商務(wù)智能。數(shù)據(jù)挖掘全部圍繞著數(shù)據(jù),成功的數(shù)據(jù)挖掘需要能夠準(zhǔn)確反映業(yè)務(wù)的數(shù)據(jù)。
企業(yè)必須懂得,數(shù)據(jù)挖掘的威力在于:抓住那些能夠從本質(zhì)上被預(yù)測(cè)或者被描述的特殊的業(yè)務(wù)難題。其中包括:
顧客分類
預(yù)測(cè)顧客的購(gòu)買傾向
監(jiān)測(cè)欺詐
優(yōu)化供應(yīng)和發(fā)貨渠道
理解了這個(gè)過(guò)程的企業(yè)就看到了真正的效果。一家中西部地區(qū)的保健供應(yīng)商識(shí)別了高風(fēng)險(xiǎn)病人,并且使用了能夠保證護(hù)理質(zhì)量和管理風(fēng)險(xiǎn)的病例管理程序。一家南美電信公司通過(guò)分析電話的使用、購(gòu)買的服務(wù)和服務(wù)質(zhì)量的評(píng)定等可能導(dǎo)致顧客減少的模式之后,發(fā)現(xiàn)了風(fēng)險(xiǎn)并防止了高價(jià)值顧客的流失。一家美國(guó)的保險(xiǎn)公司通過(guò)數(shù)據(jù)挖掘解決方案的時(shí)間段來(lái)預(yù)測(cè)并且很快地檢測(cè)欺詐,然后采取迅速行動(dòng)來(lái)最小化成本。
誤區(qū)2:數(shù)據(jù)挖掘?qū)τ谏虅?wù)應(yīng)用程序仍然是不可用的
數(shù)據(jù)挖掘是一種可用的技術(shù),并且由于他的商業(yè)效果受到了很高的評(píng)價(jià)。這個(gè)謊言似乎是那些需要解釋為什么他們不能使用這個(gè)處理過(guò)程,并且在下面這兩句話中轉(zhuǎn)來(lái)轉(zhuǎn)去的人所編造的。第一句是:“大的數(shù)據(jù)庫(kù)不能被有效地挖掘”。第二句是:“數(shù)據(jù)挖掘不能在數(shù)據(jù)倉(cāng)庫(kù)引擎中完成”。這兩句話都曾經(jīng)是正確的;就像飛機(jī)曾經(jīng)無(wú)法離開地面一樣。
讓我們同時(shí)分析這兩句話。因?yàn)榻裉斓臄?shù)據(jù)庫(kù)是這樣的大,企業(yè)都擔(dān)心數(shù)據(jù)挖掘項(xiàng)目所需的額外的IT體系結(jié)構(gòu)會(huì)帶來(lái)巨大的成本,以及每個(gè)項(xiàng)目的數(shù)據(jù)處理過(guò)程都會(huì)消耗太長(zhǎng)時(shí)間。但是今天的某些數(shù)據(jù)庫(kù)使用的并行技術(shù)使得數(shù)據(jù)庫(kù)內(nèi)部的挖掘成為可能。通過(guò)在數(shù)據(jù)庫(kù)內(nèi)部進(jìn)行挖掘,企業(yè)可以消除數(shù)據(jù)移動(dòng),利用并行處理的性能,最小化數(shù)據(jù)冗余,以及消除數(shù)據(jù)挖掘?qū)S玫恼麄€(gè)新的冗余的數(shù)據(jù)庫(kù)的創(chuàng)建及維護(hù)成本。
例如,一個(gè)包裝零售生產(chǎn)企業(yè)使用數(shù)據(jù)挖掘來(lái)維護(hù)一個(gè)顧客忠誠(chéng)度程序,這個(gè)程序可以幫助它的零售伙伴監(jiān)控促銷的效果,并且分析購(gòu)買者的購(gòu)物籃。最初這個(gè)分析曾經(jīng)是鼓勵(lì)它的伙伴促銷他們的產(chǎn)品的有效手段。然而隨這需要處理的數(shù)據(jù)量變得越來(lái)越大,以致于這個(gè)提供給零售伙伴的服務(wù)成本變得過(guò)于昂貴。雖然這個(gè)分析過(guò)程是在一個(gè)很強(qiáng)大的服務(wù)器上面進(jìn)行的,但是5個(gè)分析應(yīng)用程序仍然用了超過(guò)312個(gè)小時(shí)來(lái)處理數(shù)據(jù)。
在結(jié)束這個(gè)有價(jià)值的服務(wù)之前,這家企業(yè)嘗試了數(shù)據(jù)庫(kù)內(nèi)部的數(shù)據(jù)挖掘技術(shù)。他們將數(shù)據(jù)載入一個(gè)集中的數(shù)據(jù)倉(cāng)庫(kù),然后將5個(gè)分析程序全部轉(zhuǎn)換為一個(gè)在數(shù)據(jù)庫(kù)中運(yùn)行的SQL(標(biāo)準(zhǔn)查詢語(yǔ)言)程序,利用它的并行處理能力。通過(guò)轉(zhuǎn)換為數(shù)據(jù)庫(kù)內(nèi)部的數(shù)據(jù)挖掘,他們能夠?qū)?zhí)行時(shí)間從用戶忠誠(chéng)度程序的超過(guò)312小時(shí)縮小到12小時(shí)。
誤區(qū)3:數(shù)據(jù)挖掘需要單獨(dú)的、專用的數(shù)據(jù)庫(kù)
數(shù)據(jù)挖掘產(chǎn)品供應(yīng)商會(huì)強(qiáng)調(diào)你需要一個(gè)昂貴的、專用的數(shù)據(jù)庫(kù)、數(shù)據(jù)中心或者分析服務(wù)器來(lái)進(jìn)行數(shù)據(jù)挖掘,因?yàn)樾枰獙?shù)據(jù)轉(zhuǎn)換為一種特別的格式來(lái)進(jìn)行有效地處理。這些數(shù)據(jù)中心不僅采購(gòu)和維護(hù)成本很高,每個(gè)單獨(dú)的數(shù)據(jù)挖掘項(xiàng)目還需要單獨(dú)抽取數(shù)據(jù),而數(shù)據(jù)的抽取是很昂貴并且非常費(fèi)時(shí)的。
數(shù)據(jù)庫(kù)技術(shù)的發(fā)展使得現(xiàn)在數(shù)據(jù)挖掘再也不需要在一個(gè)單獨(dú)的數(shù)據(jù)中心進(jìn)行了。實(shí)際上,有效的數(shù)據(jù)挖掘需要一個(gè)企業(yè)范圍的數(shù)據(jù)倉(cāng)庫(kù),它的全部投資成本也比使用獨(dú)立的多個(gè)數(shù)據(jù)中心便宜得多了。
原因是這樣的:由于企業(yè)需在整個(gè)企業(yè)范圍之上實(shí)現(xiàn)數(shù)據(jù)挖掘項(xiàng)目,利用數(shù)據(jù)挖掘模型的用戶數(shù)量和其對(duì)數(shù)據(jù)基礎(chǔ)設(shè)施型都會(huì)持續(xù)增長(zhǎng)。一個(gè)先進(jìn)的企業(yè)數(shù)據(jù)倉(cāng)庫(kù)不僅能有效地存儲(chǔ)所有的企業(yè)數(shù)據(jù),同時(shí)也消除大多數(shù)額外的數(shù)據(jù)中心或數(shù)據(jù)倉(cāng)庫(kù)的需求,另外這也為數(shù)據(jù)挖掘項(xiàng)目提供一個(gè)理想的基礎(chǔ)。這個(gè)基礎(chǔ)就是一個(gè)單一的企業(yè)范圍的數(shù)據(jù)倉(cāng)庫(kù),這個(gè)數(shù)據(jù)倉(cāng)庫(kù)可以提供一個(gè)具有一致性和即時(shí)性的顧客視圖。并且通過(guò)在數(shù)據(jù)倉(cāng)庫(kù)內(nèi)部合并數(shù)據(jù)挖掘的外延,企業(yè)可以以兩種另外的方式縮減成本。第一種方式是,沒(méi)有必要購(gòu)買和維護(hù)僅為數(shù)據(jù)挖掘使用的額外的硬件。第二種方式是,企業(yè)將為實(shí)施數(shù)據(jù)挖掘項(xiàng)目所需的數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)導(dǎo)入導(dǎo)出的工作量減少到最低,這已經(jīng)是公認(rèn)的極耗費(fèi)工時(shí)和資源的處理過(guò)程。
誤區(qū)4:只有擁有博士學(xué)位才可以進(jìn)行數(shù)據(jù)挖掘
一些人認(rèn)為數(shù)據(jù)挖掘非常復(fù)雜,以致必須擁有至少三個(gè)博士才可以執(zhí)行它:一個(gè)是統(tǒng)計(jì)學(xué)或者計(jì)量方法專業(yè)博士,一個(gè)是能夠懂得客戶的商務(wù)博士,一個(gè)是計(jì)算機(jī)專業(yè)博士。
實(shí)際情況是在成功項(xiàng)目的實(shí)施者中根本用不到一個(gè)博士。例如,Teradata最近完成了一個(gè)南美電信公司的項(xiàng)目,它成功地追蹤了顧客行為變化,幫助公司在電信市場(chǎng)開放期間保住了98%的高價(jià)值客戶。通過(guò)協(xié)力工作,一個(gè)多學(xué)科的小組成功地完成了任務(wù)。
數(shù)據(jù)挖掘是一項(xiàng)需要三個(gè)專業(yè)領(lǐng)域的技術(shù)專家共同合作的工作。商務(wù)人員必須通過(guò)創(chuàng)建一組商業(yè)問(wèn)題來(lái)引導(dǎo)項(xiàng)目,解釋凸現(xiàn)的模式。具有對(duì)數(shù)據(jù)挖掘技術(shù)、統(tǒng)計(jì)學(xué)和工具的充分了解的分析建模人員構(gòu)建可靠的模型。IT人員提供對(duì)處理過(guò)程的深刻觀察,理解數(shù)據(jù),并提供關(guān)鍵的技術(shù)支持。
誤區(qū)5:數(shù)據(jù)挖掘是給那些擁有大量客戶數(shù)據(jù)的大公司提供的
一個(gè)簡(jiǎn)單的事實(shí)就是,一個(gè)公司,無(wú)論大小,只要擁有能夠精確反映業(yè)務(wù)或者客戶情況的數(shù)據(jù),都能在這些數(shù)據(jù)基礎(chǔ)上構(gòu)建模型,對(duì)應(yīng)重要的業(yè)務(wù)挑戰(zhàn)。公司處理的顧客數(shù)據(jù)量從來(lái)就不是關(guān)鍵。
例如,Midwest Card Services (MCS)為大約20萬(wàn)客戶提供了電話行銷、自動(dòng)取款機(jī)管理、借記卡和專業(yè)化金融服務(wù)。這家公司使用了一個(gè)集中的數(shù)據(jù)庫(kù)以更好地理解它的客戶基礎(chǔ),有效地對(duì)客戶分類,理解他們的行為模式和嗜好。這使得MCS改善了他們自身的財(cái)政管理能力,并且為他們的客戶的投資組合提供了廣泛全面的報(bào)告。
抓住時(shí)機(jī)
概要:數(shù)據(jù)挖掘再也不是運(yùn)行緩慢、昂貴,或者過(guò)于復(fù)雜的技術(shù)。成熟的技術(shù)和商務(wù)經(jīng)驗(yàn)使得一個(gè)有效的節(jié)省成本的處理過(guò)程成為可能。各種規(guī)模的公司都可以檢驗(yàn)他們以前對(duì)該技術(shù)的誤解,證明數(shù)據(jù)挖掘在今天激烈競(jìng)爭(zhēng)的,以顧客為本的商業(yè)世界中對(duì)企業(yè)的業(yè)務(wù)成功會(huì)起到至關(guān)重要的作用。
聯(lián)系客服