KnowledgeSTUDIO
平臺:NT , Windows 9X
功能:CHAID算法,支持PMML,留有與SAS、S-Plus的接口,能夠靈活地導(dǎo)入外部模型和產(chǎn)生規(guī)則,包含神經(jīng)網(wǎng)絡(luò)建模的能力
優(yōu)點(diǎn):響應(yīng)快,模型、文檔易于理解,決策樹分析直觀/性能良好,SDK中容易加入新的算法
缺點(diǎn):決策樹不能編輯打印,SDK缺乏數(shù)據(jù)預(yù)處理階段的函數(shù),沒有示例代碼,不支持AIX
應(yīng)用行業(yè)案例
1. Frost National銀行CRM收益率、客戶滿意度、產(chǎn)品功效
2. SASI公司利用SDK開發(fā)行業(yè)數(shù)據(jù)挖掘應(yīng)用軟件(零售行業(yè))
3. Montreal銀行客戶分片、越區(qū)銷售模型、市場站的準(zhǔn)備、抵押支付的預(yù)測、信用風(fēng)險的分析
BusinessMiner 4.1
平臺:Windows 平臺,支持多數(shù)據(jù)源
功能:直觀的決策樹技術(shù), 提供所有的分類數(shù)據(jù)挖掘功能,包括:建模、發(fā)現(xiàn)、可視化、假設(shè)分析和分片。支持RDB、DW、OLAP、文件。
優(yōu)點(diǎn):易于使用,價格便宜$495,文檔齊全
缺點(diǎn):只具有決策樹功能
應(yīng)用行業(yè)案例:
D&J WADE ASSOCIATES是一個數(shù)據(jù)倉庫和商業(yè)智能咨詢公司,利用BO公司的產(chǎn)品做商業(yè)智能解決方案
國際上大約有7000多公司在使用Business Objects
Cognos Scenario
平臺:Windows 平臺
功能:Scenario是基于樹的高度視圖化的數(shù)據(jù)挖掘工具,決策樹的基本功能是創(chuàng)立一系列標(biāo)準(zhǔn),預(yù)測記錄中目標(biāo)市場的價值。Scenario的分類樹分階展現(xiàn)各種因素;最終用戶通過挖掘或展開樹的分支來探察數(shù)據(jù)。
特點(diǎn):Scenario的抽樣技術(shù)可以用最少的處理開銷和最短的響應(yīng)
應(yīng)用行業(yè)案例:
企業(yè)經(jīng)理們可以利用Scenario的統(tǒng)計方法,深入挖掘影響商務(wù)趨勢的因素的潛在含義,根據(jù)風(fēng)險特性將個體與群體客戶歸類;將商務(wù)因素分門別類,辨清商務(wù)目標(biāo)所受的主要影響;探察與通常數(shù)據(jù)模式不符的異常情況等。
Northwood公司利用該產(chǎn)品發(fā)現(xiàn)影響樹木死亡率的模式和因素。
時間得出最精確的結(jié)果。給各種因素定級。
Comshare Decision and Decision Web
Commander FDC/EIS Decision
平臺:LAN-客戶端Windows 9X,服務(wù)器NT,Internet-Web服務(wù)器
功能:具有強(qiáng)大的分析能力,包括: grids, 鉆入, 旋轉(zhuǎn), 圖表, 映射, 特殊計算,等。內(nèi)置引導(dǎo)分析功能,交互式分析多維數(shù)據(jù)。
優(yōu)點(diǎn):易于使用,安裝簡單
缺點(diǎn):ICE (智能組件擴(kuò)充)按鈕在DecisionWeb 中不可用,文檔不全面
應(yīng)用行業(yè)案例:
VDK 冷凍食品公司利用 COMSHARE DECISION AND DECISION WEB進(jìn)行決策分析
Welch Allyn公司利用FDC/EIS Decision進(jìn)行金融決策分析
DataCruncher
平臺:Pentium PC
功能:特殊的報表
優(yōu)點(diǎn):響應(yīng)時間快,能將數(shù)據(jù)挖掘報表轉(zhuǎn)化成HTML格式。
缺點(diǎn):圖形界面不友好,難操作
應(yīng)用行業(yè)案例:ADP集團(tuán)利用Data Cruncher分析客戶定單及交易數(shù)據(jù),提高客戶滿意程度。
DBStar Migration Architect
平臺:Sun Sparc 20/Solaris,HP/UX IBM/AIX
功能:數(shù)據(jù)分析工具,發(fā)現(xiàn)數(shù)據(jù)質(zhì)量問題以及數(shù)據(jù)元素和其它內(nèi)在的數(shù)據(jù)驅(qū)動的商業(yè)規(guī)則之間互相依賴的關(guān)系。在多個源數(shù)據(jù)與統(tǒng)一的目標(biāo)數(shù)據(jù)之間建立映射。(數(shù)據(jù)倉庫的數(shù)據(jù)抽取和轉(zhuǎn)化功能)
優(yōu)點(diǎn):可靠地決定數(shù)據(jù)質(zhì)量,實(shí)時跟蹤數(shù)據(jù)的改變并維持?jǐn)?shù)據(jù)的一致性。不是使用元數(shù)據(jù),而是利用實(shí)際數(shù)據(jù)進(jìn)行細(xì)節(jié)數(shù)據(jù)分析。
缺點(diǎn):Motif用戶界面使用不直觀
應(yīng)用行業(yè)案例:某零售、投資、以及代理服務(wù)的金融服務(wù)公司利用DBStar的Migration Architect進(jìn)行數(shù)據(jù)倉庫項目的開發(fā)
MODEL 1
平臺:Windows NT,Windows 9X
Indiana大學(xué)的Kelley 商學(xué)院使用MODEL1作為MBA數(shù)據(jù)挖掘教學(xué)軟件。教學(xué)生如何分析客戶數(shù)據(jù)庫得出新的建議、保留老客戶、最
功能:靈活的數(shù)據(jù)抽取能力,數(shù)據(jù)編輯器能夠創(chuàng)建新的數(shù)據(jù)變量,掃描無效數(shù)據(jù)。產(chǎn)生基本的線圖、柱狀圖、稀疏圖表、均值、和頻率分布、以及l(fā)ift圖表。具有客戶分片模型、響應(yīng)模型、交叉銷售分析和客戶評估。適合多種預(yù)言模型包括:RFM, Bayes, 線性和logistic回歸, 神經(jīng)網(wǎng)絡(luò), CHAID and CART 模型。
優(yōu)點(diǎn):易于使用,廣泛的模型。具有友好的wizard建模過程詢問數(shù)據(jù)的格式和希望分析的層次。可以定制建模過程。非常適合直接市場應(yīng)用。
缺點(diǎn):不適合縱向數(shù)據(jù)的時序分析,不能創(chuàng)建Script自動執(zhí)行用戶經(jīng)常使用的一系列命令,價格昂貴,用戶不能直接編輯報表,數(shù)據(jù)轉(zhuǎn)化復(fù)雜,用戶必須將外部數(shù)據(jù)轉(zhuǎn)換為固定格式的文本文件才能進(jìn)行挖掘
應(yīng)用行業(yè)案例:
大化客戶的生命周期價值,從而作出一對一的市場。學(xué)生分析人口統(tǒng)計數(shù)據(jù)、POS交易數(shù)據(jù)、商品目錄和經(jīng)常購買的數(shù)據(jù)。利用MODEL1做客戶分片,分析過去推銷的商品的有效性,定位將來的市場,增加交叉銷售,標(biāo)記最有價值的客戶。
Fort Worth Star-Telegram是新聞單位,利用MODEL1進(jìn)行數(shù)據(jù)庫營銷
DRG集團(tuán)是出版公司,利用MODEL1進(jìn)行MAIL戰(zhàn)略
HDS 5780 Nucleus Exploration Series
平臺:64-bit UNIX, 32-bit Windows NT,個人版本-Windows 9X
功能:數(shù)據(jù)倉庫建模
優(yōu)點(diǎn):簡化了數(shù)據(jù)倉庫的邏輯和服務(wù)模型設(shè)置,性能高,能夠查詢壓縮數(shù)據(jù)
缺點(diǎn):1小時裝載1.5G數(shù)據(jù),速率慢,可能由于壓縮的原因
First Citizens Bank利用該產(chǎn)品建設(shè)數(shù)據(jù)倉庫
應(yīng)用行業(yè)案例:Canadian National Railway (CN)加拿大國家鐵路局利用該軟件產(chǎn)品構(gòu)建數(shù)據(jù)倉庫
Falcon Retail
平臺:IBM mainframe或 UNIX
功能:神經(jīng)網(wǎng)絡(luò)
優(yōu)點(diǎn): 減少人工分析的勞動力
缺點(diǎn): 分析過程難以理解
應(yīng)用行業(yè)案例:Sears, Roebuck and Co.公司是大的服飾、家庭和汽車零售商,利用該產(chǎn)品分析其忠誠卡交易的欺詐行為
平臺:AIX,Window NT ,OS/390 ,Sun Solaris
功能:自動實(shí)現(xiàn)數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)發(fā)掘和結(jié)果呈現(xiàn)這一整套數(shù)據(jù)挖掘操作。具體算法包括:典型數(shù)據(jù)集自動生成、概念性分類、聚集(人口統(tǒng)計分析demographic、神經(jīng)網(wǎng)絡(luò))、分類(樹歸納和神經(jīng)歸納)、估值、關(guān)聯(lián)規(guī)
Decision Edge for Finance——專門為金融行業(yè)設(shè)計的綜合解決方案。Decision Edge for Finance不僅僅是簡單的報告工具,它提供了行銷經(jīng)理所需的全部技術(shù),以制定戰(zhàn)略業(yè)務(wù)決策并開展行銷活動。
Decision Edge for Insurance——端到端的解決方案,包括硬件、軟件、顧問和服務(wù),其設(shè)計目的是幫助保險業(yè)行銷經(jīng)理制定戰(zhàn)略業(yè)務(wù)決策并開展行銷活動。
則、序列模式、預(yù)言模型,以及結(jié)果可視化呈現(xiàn)。
優(yōu)點(diǎn):Intelligent Miner for Text可以提供一定程度的定制,具有可擴(kuò)展性,索引的速度很快,具有先進(jìn)的語言分析能力、聚集和過濾能力。Intelligent Miner有強(qiáng)大的API函數(shù)庫,可以創(chuàng)建定制的模型。能夠處理巨大的數(shù)據(jù)量,同時支持并行處理,查詢速度很快。
缺點(diǎn):Intelligent Miner for Text圖形界面GUI不友好,spider和indexing管理需要對UNIX非常熟悉。對一個挖掘?qū)ο髮⒍鄠€挖掘操作一起執(zhí)行(批處理)比較困難。元數(shù)據(jù)不開放,結(jié)構(gòu)復(fù)雜。文檔缺乏錯誤代碼的詳細(xì)解釋。沒有對算法的詳細(xì)說明。
IBM Discovery Series for Banking——為滿足“客戶至上”的銀行業(yè)需求而設(shè)計的應(yīng)用程序套件。
IBM Discovery for telecommunications——為電信行業(yè)提供完美的客戶服務(wù)的應(yīng)用程序套件。
Business Analysis Suite for SAP——適用于下列公司:已經(jīng)安裝SAP事務(wù)處理系統(tǒng),并需要建立數(shù)據(jù)倉庫,以充分利用日常運(yùn)作中收集的所有事務(wù)數(shù)據(jù)。
Surf-Aid——數(shù)據(jù)采集應(yīng)用程序,用于分析Web站點(diǎn)利用率。
Info Print Business Intelligence Solution——允許企業(yè)將自定義消息、姓名及地址同圖形和條形碼相結(jié)合,向客戶提供有獨(dú)特個性的行銷資料。
Global Services BI Offering——包含不同角度(行業(yè)、業(yè)務(wù)功能、技術(shù))的戰(zhàn)略和規(guī)劃功能,以及幫助客戶理解和解決業(yè)務(wù)困難、管理數(shù)據(jù)倉庫項目、開發(fā)和實(shí)現(xiàn)先進(jìn)分析功能的方法。
Insurance Underwriting Profitability Analysis-將數(shù)據(jù)倉庫和數(shù)據(jù)采集技術(shù)相結(jié)合,幫助保險業(yè)執(zhí)行人員處理保險業(yè)過程。
平臺:Solaris,Retail Sales Forecasting System運(yùn)行在Intranet的Web服務(wù)器上
功能:PatternWarehouse 提供商業(yè)用戶迅速訪問已經(jīng)獲得的模式:客戶行為,product usage affinities,生命周期, 等等。PatternWarehouse 提供PQL-模式查詢語言,查詢模式,就象用SQL語言查詢數(shù)據(jù)一樣。操作循環(huán)如下:數(shù)據(jù)挖掘在每周/月定時執(zhí)行,發(fā)現(xiàn)的模式存儲在模式庫中,模式周期性增加組合和趨勢分析,用戶查詢已經(jīng)挖掘的模式庫,而不是關(guān)系數(shù)據(jù)庫?;贘ava技術(shù),在、查詢通過Intranet的Web瀏覽器接口。
優(yōu)點(diǎn):模式存儲起來,對于緊迫的問題不需重新計算。數(shù)據(jù)挖掘是對整個數(shù)據(jù)庫,不是抽樣或抽取部分?jǐn)?shù)據(jù)。模式存儲在一個中心倉庫,確保了統(tǒng)一的視圖。報表用淺顯的語言和圖形自動產(chǎn)生。
缺點(diǎn):較難向用戶解釋PatternWarehouse和數(shù)據(jù)倉庫框架的區(qū)別,在從事數(shù)據(jù)挖掘項目沒有一個好的頂層的體系結(jié)構(gòu)。
應(yīng)用行業(yè)案例:E*TRADE 是一個網(wǎng)上投資服務(wù)公司,隨著基于Web的金融服務(wù)競爭的加劇,數(shù)據(jù)挖掘技術(shù)構(gòu)成了制勝的資本,E*TRADE利用patternwarehouse數(shù)據(jù)發(fā)現(xiàn)系統(tǒng)對客戶行為進(jìn)行分析,制定合適的市場策略。
Deere & Company是農(nóng)業(yè)工具零售公司,利用Retail Sales Forecasting System成功地預(yù)測了其拖拉機(jī)產(chǎn)品的第二年的銷售。
平臺:Windows,UNIX,可以和Microsoft Web solutions, Windows 95, Windows NT and Arbor Essbase, SQL Server, Oracle等集成,開發(fā)工具: VB, Java.
功能:ForecastX包括核心的預(yù)測技術(shù)和統(tǒng)計分析。有廣泛的應(yīng)用:金融計劃、風(fēng)險分析、銷售預(yù)測、需求計劃、生產(chǎn)計劃,以及統(tǒng)計建模。ForecastX是一個分布式對象,可以和運(yùn)行在UNIX或Windows上的應(yīng)用程序集成。具有強(qiáng)大的預(yù)測引擎,包括30多個統(tǒng)計功能。
優(yōu)點(diǎn):沒有數(shù)據(jù)量的限制,量的大小處決于運(yùn)行的計算機(jī)。即使沒有統(tǒng)計知識也能進(jìn)行復(fù)雜的分析。對象模型易于導(dǎo)航,性能顯著。
缺點(diǎn):產(chǎn)品文獻(xiàn)只有HTML格式, 沒有易于操作的幫助。對于同一個問題有多種解決方法,很難判斷哪一種解決方法好。
應(yīng)用行業(yè)案例:HITechnologies公司是一個市場咨詢公司,利用ForecastX的預(yù)測控件組件(ActiveX)開發(fā)HITools Enterprise Suite, 該軟件提供供需鏈管理,制定供需計劃,增加管理one-to-one 市場的能力。
:GTE是一個電信公司,整個市場分為四個部分:無線、ISP、長途和本地電話, GTE利用ForecastX預(yù)測各項產(chǎn)品和服務(wù)的增長和收入。
平臺:Windows NT/9X
功能:軟件包括:數(shù)據(jù)預(yù)處理、預(yù)言建模、以及模型配置和打分。建模組件能夠分析T級別的數(shù)據(jù)和支持多種數(shù)據(jù)挖掘算法。pattern能夠?qū)⒃S多不同的模型的最好的因素連接成一個全體的模型。有特定行業(yè)的模型模板。模型配置和打分組件能夠?qū)δP瓦M(jìn)行修改,同時也能配置SAS和其他流行的建模工具構(gòu)造的模型。
優(yōu)點(diǎn):精確性高,能處理T級別的數(shù)據(jù)。
缺點(diǎn): GUI不友好,命令行接口比GUI容易使用。目前版本只支持Windows,今后會支持Unix。
應(yīng)用行業(yè)案例:Polk是一個多媒體智能信息解決方案提供商。有超過111 million個家庭的人口統(tǒng)計和生活方式的數(shù)據(jù)庫,利用pattern預(yù)言對一個直接MAIL營銷的響應(yīng)。
平臺: Windows NT,Windows 9X
功能:將人口統(tǒng)計(demographic)數(shù)據(jù)按照地圖的格式可視化,
Meineke是一個汽車銷售和修理的連鎖公司,利用TargetPro分析demographic數(shù)據(jù),作市場決策。
能夠創(chuàng)建高質(zhì)量的地圖,幫助決策制定和增強(qiáng)報表和表達(dá)方式。
優(yōu)點(diǎn):能夠分析超過600個變量,響應(yīng)速度很快。
缺點(diǎn):操作手冊不詳細(xì)。
平臺:Windows NT.
功能: 用C語言表達(dá)預(yù)言方程(equation),這些方程能夠和數(shù)據(jù)倉庫集成,用于計算預(yù)言值,然后用這些預(yù)言值來作為數(shù)據(jù)倉庫選擇數(shù)據(jù)的條件。
優(yōu)點(diǎn):預(yù)言功能可靠性高,模型開發(fā)的速度快。
缺點(diǎn):預(yù)言變量類型的轉(zhuǎn)換對用戶是非常麻煩的。
應(yīng)用行業(yè)案例:ASC公司為客戶提供數(shù)據(jù)庫營銷服務(wù)。開發(fā)和實(shí)現(xiàn)客戶的預(yù)言模型,以提高其營銷的效率。ASC公司需要一種快速有效的方式構(gòu)建預(yù)言模型,并且已經(jīng)運(yùn)行神經(jīng)網(wǎng)絡(luò)很多年,在對ModelQuest Expert測試后,發(fā)現(xiàn)它縮短了預(yù)言模型開發(fā)的速度,并且其有效性在實(shí)際的營銷策略得到了驗(yàn)證。
S-PLUS 4.5 Professional for Windows
S-Plus for Unix 5.1
平臺:StatServer 只能運(yùn)行在Windows NT,其它產(chǎn)品能夠運(yùn)行在UNIX、Windows NT/9X
功能:StatServer是一個數(shù)據(jù)挖掘引擎和事務(wù)服務(wù)器,用戶能夠通過多種客戶端(瀏覽器,MS Excel等等)進(jìn)行統(tǒng)計分析和信息可視化。 對于StatServer 而言,客戶統(tǒng)計模型和數(shù)據(jù)挖掘程序固定在S-PLUS語言內(nèi),存儲在中心服務(wù)器上。分析通過S-PLUS引擎運(yùn)行在服務(wù)器端,結(jié)果返回給客戶端。StatServer能夠通過多個數(shù)據(jù)源抽取數(shù)據(jù),也能通過客戶端上載數(shù)據(jù)。StatServer能夠讓組織開發(fā)、維護(hù)、配置定制統(tǒng)計分析和可視化方法。StatServer 適合NT體系結(jié)構(gòu),提供了一個強(qiáng)壯的報表環(huán)境和MS ASP引擎相互補(bǔ)充。服務(wù)器端工具的組合 (MS IIS, MS ASP, COM business objects, MS Transaction Server, StatServer,以及關(guān)系數(shù)據(jù)庫,比如: MS SQL Server、 Oracle) 和簡單的客戶端構(gòu)成了一個靈活的、強(qiáng)壯的、可擴(kuò)展的遠(yuǎn)程數(shù)據(jù)挖掘和圖形報表系統(tǒng)。
S-PLUS 是一個包括S語言、SQL和統(tǒng)計包混合的系統(tǒng),能夠用可視化的方式勘探數(shù)據(jù)。具有import/export的功
Waratah公司提供統(tǒng)計、數(shù)據(jù)挖掘、數(shù)據(jù)倉庫、以及軟件開發(fā)服務(wù)。在為一個健康中心開發(fā)應(yīng)用的時候,利用StatServer 開發(fā)定制的基于瀏覽器的客戶端應(yīng)用,以分析和可視化病人的數(shù)據(jù)。另外也為一個制藥公司分析其實(shí)驗(yàn)數(shù)據(jù)。Waratah主要利用StatServer 進(jìn)行二次開發(fā),因?yàn)槠淇蛻舳耸菫g覽器或者M(jìn)S Excel,用戶能夠方便地使用。
Federal Communications Commission為了利用信息進(jìn)行決策分析,該單位的經(jīng)濟(jì)學(xué)家利用S-Plus解決統(tǒng)計和經(jīng)濟(jì)分析問題。
Maple Partners Financial Products 利用S-PLUS 創(chuàng)建和測試定量的貿(mào)易模型。
應(yīng)用行業(yè)案例:Cereals是一個食品公司,其基因研究利用S-PLUS軟件的數(shù)據(jù)挖掘功能分析大米基因數(shù)據(jù)。使用了mapping和 sequencing 技術(shù)。
Pillsbury是一個食品公司,利用StatServer和S-PLUS創(chuàng)建基于Web的數(shù)據(jù)分析環(huán)境。
能。S-PLUS既具有基于Windows的圖形接口,又有命令行接口。支持多種數(shù)據(jù)庫的數(shù)據(jù)格式。S語言專門用于向量編程和分析,已經(jīng)和Windows風(fēng)格的界面集成。強(qiáng)大的圖形功能包括:畫刷brushing, 旋轉(zhuǎn)spinning, plotting a matrix of pairs, contour maps, heat maps 、 interpolated surfaces
優(yōu)點(diǎn):StatServer COM對象模型是一個很好的編程接口。S-Plus非常精確。圖形、數(shù)據(jù)對象、分析結(jié)果都能和微軟的程序集成,比如:PowerPoint、Word、Excel。Import/export的功能縮短了數(shù)據(jù)移動的時間和開銷。
缺點(diǎn):StatServer需要充分的資源和一臺專門的服務(wù)器。StatServer不是一個service,需要登錄進(jìn)入StatServer這臺計算機(jī)啟動程序,有時會象NT一樣出現(xiàn)問題,需要重新啟動。
S語言的靈活性使得有時很難指出如何寫一個特定的程序。整個系統(tǒng)過于復(fù)雜,目前不支持Linux。
Max
平臺:Microsoft NT,Microsoft SQL Server 7.0 OLAP Services.
功能:可視化的多維分析功能。具有友好的wizards 導(dǎo)航。
優(yōu)點(diǎn):Max自動地匯總數(shù)據(jù),易于使用。"Find Similar" 分析特別有用,因?yàn)樗苎杆俚匕l(fā)現(xiàn)異常情況。
缺點(diǎn):MAX是一個客戶端程序,客戶端開銷很大。報表能力應(yīng)該被提高,2000年的產(chǎn)品和MS Office能夠集成。
應(yīng)用行業(yè)案例:Afek Information System Engineering Ltd是一個計算機(jī)咨詢公司。提供多方面的解決方案,包括:計算機(jī)系統(tǒng)分析,信息系統(tǒng)開發(fā),ERP系統(tǒng)實(shí)施,以及物流項目管理和實(shí)施。利用Max進(jìn)行圖形化的多維分析,而不需要分析專家 。
Spiritus Trading Ltd.是PC機(jī)及外圍設(shè)備貿(mào)易公司。利用Max分析客戶和供應(yīng)商的數(shù)據(jù)。
還有其他數(shù)據(jù)挖掘軟件期待大家查看呦!
PolyAnalyst Pro
TextAnalyst
平臺:Windows NT
功能:PolyAnalyst提供下列功能:數(shù)據(jù)訪問、數(shù)據(jù)操縱和清洗、機(jī)器學(xué)習(xí)、可視化和報表。直接訪問與ODBC兼容的各種數(shù)據(jù)源,數(shù)據(jù)和挖掘結(jié)果能夠與MS Excel集成。提供構(gòu)造數(shù)據(jù)子集和變量轉(zhuǎn)換的功能。數(shù)據(jù)分析自學(xué)習(xí)引擎包括: PolyNet預(yù)言器, GMDH (Group Method Data Handling) 和神經(jīng)網(wǎng)絡(luò)混合的方法,基于演化編程技術(shù)-
Wisconsin-Madison大學(xué)UW Medical School 和School of Nursing的Research Design and Statistics Unit (RDSU) 為生物醫(yī)藥研究提供高層的統(tǒng)計和設(shè)計支持。典型的生物統(tǒng)計技術(shù)過于復(fù)雜,神經(jīng)網(wǎng)絡(luò)難于理解,所以利用PolyAnalyst Pro基于符號知識技術(shù)發(fā)現(xiàn)規(guī)則和結(jié)構(gòu)。目前該軟件在腎臟學(xué)nephrology,小兒科 pediatrics以及phonology/ communicative disorders運(yùn)行的非常成功。
Boeing公司是世界最大的航空公司。將多個復(fù)雜的系統(tǒng)集成在一起是其成功的基礎(chǔ)之一,工程組希望找到一種工具,能夠迅速地構(gòu)建非線性過程的模型作為內(nèi)置實(shí)時系統(tǒng)的一部分。傳統(tǒng)的曲線配置curve
發(fā)現(xiàn)規(guī)律,發(fā)現(xiàn)依賴關(guān)系的勘探引擎,分類引擎,聚集引擎,以及多參數(shù)線性回歸以發(fā)現(xiàn)數(shù)據(jù)中的線性關(guān)系。PolyAnalyst具有集成的GUI環(huán)境。發(fā)現(xiàn)規(guī)律引擎,利用了符號知識獲取技術(shù) (SKAT), 自動化地發(fā)現(xiàn)數(shù)據(jù)中的依賴關(guān)系和規(guī)則,并且用清晰的數(shù)學(xué)語言表達(dá)。PolyAnalyst是一個多策略的數(shù)據(jù)挖掘解決方案。能夠處理數(shù)字、種類、布爾型變量。任何一個引擎都能作為一個單獨(dú)的COM組件,COM組件能夠和其他軟件集成。
TextAnalyst在一個知識庫上使用,包括問題的文本描述,內(nèi)容分析、創(chuàng)建語義網(wǎng)絡(luò)。
優(yōu)點(diǎn):圖形接口友好,各種建模技術(shù)易于掌握。發(fā)現(xiàn)的規(guī)則用一種標(biāo)準(zhǔn)符號表達(dá),適合在其他平臺編程,增加了產(chǎn)品的可用性。
缺點(diǎn):PolyAnalystPro 3.5缺乏將表達(dá)式剪切并且粘貼在其他軟件中的能力。打印不方便、不靈活,需要增加數(shù)據(jù)和模型的編輯以及清洗的功能。基本的統(tǒng)計功能不夠強(qiáng)大。TextAnalyst不能和其他軟件集成。
fitting和神經(jīng)網(wǎng)絡(luò)技術(shù)開發(fā)需要很多時間,并且代價昂貴。PolyAnalyst的符號知識獲取技術(shù)發(fā)現(xiàn)規(guī)律算法提供了一種很好的性能和復(fù)雜性的平衡。
LLC 公司的仙人掌策略Cactus Strategies是一個咨詢解決方案,該方案集中在創(chuàng)建啟發(fā)式預(yù)言商業(yè)工具和模型、商業(yè)開發(fā)和電子商務(wù)解決方案和應(yīng)用。Cactus Strategies 提供的商業(yè)工具最關(guān)鍵的一個特點(diǎn)是能夠從通常的人口信息和合同信息以及客戶描述信息中精確地選擇最有可能響應(yīng)的客戶。PolyAnalyst 是工具啟發(fā)能力的核心,它能周期性地從數(shù)據(jù)中建模和給記錄打分。
應(yīng)用行業(yè)案例:
BioVisioN是一個生物研發(fā)公司,目標(biāo)是使藥物發(fā)現(xiàn)和診斷方面的技術(shù)商業(yè)化,對標(biāo)識peptides縮氨酸和蛋白質(zhì)proteins有很高的技術(shù),由研發(fā)產(chǎn)生了大量數(shù)據(jù)。BioVisioN利用PolyAnalyst分析各種疾病在人體血液和尿液中的模型發(fā)現(xiàn)疾病的關(guān)聯(lián),以尋找診斷方法。
MIS Alea and MIS DeltaMiner
平臺:Windows
功能:DeltaMiner是一個激活的搜索代理,專門用于異常報告、控制和分析。MIS Alea 是一個多維應(yīng)用/服務(wù),在Microsoft Excel 的環(huán)境內(nèi)處理商業(yè)模型。
優(yōu)點(diǎn):維度非常靈活,具有定制的功能。wizard和 menu驅(qū)動非常友好。
缺點(diǎn):需要一定的專業(yè)技能才能掌握該工具的各種功能。
應(yīng)用行業(yè)案例:HP公司利用該軟件發(fā)現(xiàn)對中小企業(yè)的銷售趨勢,發(fā)現(xiàn)問題,作出預(yù)測。
datawarehouse/products/datamining
Darwin
平臺:Windows NT/95 client/server,UNIX :Sun Solaris, HP-UX 支持單個或多處理器環(huán)境
功能:通過ODBC訪問ASCII和RDBMS數(shù)據(jù)。構(gòu)造模型的過程有wizards引導(dǎo)。Darwin 3.5支持?jǐn)?shù)據(jù)挖掘算法:神經(jīng)網(wǎng)絡(luò),分類和回歸樹,K-最近鄰居、遺傳算法、基于記
應(yīng)用行業(yè)案例:Two Crows公司是專門的數(shù)據(jù)挖掘和數(shù)據(jù)倉庫市場分析和咨詢公司。Two Crows和財富1000強(qiáng)公司合作,幫助他們開發(fā)數(shù)據(jù)挖掘策略、選擇產(chǎn)品和實(shí)施數(shù)據(jù)挖掘解決方案,同時也和數(shù)據(jù)挖掘軟件商合作幫助他們理解客戶需求。公司需要理解客戶,使得能夠有效地獲取新的客戶、在原有客戶上獲得更多贏利、防止客戶流失。行業(yè)研究表明獲得一個新的客戶必須花費(fèi)維持一個老客戶的5-6倍開銷,公司目前都想求助于數(shù)據(jù)挖掘來提升客戶關(guān)系管理。海量數(shù)據(jù)和成百個變量
憶的推理(memory-based reasoning)、聚集和貝葉斯算法。Darwin使用 MS Excel 作為可視化數(shù)據(jù)挖掘結(jié)果和基于MS IE在線幫助。Oracle選擇TMC(Thinking Machines Company)最為合作伙伴。Darwin的模型探索器Model Seeker和關(guān)鍵領(lǐng)域?qū)Ш終ey Fields wizards, 交互式的樹顯示interactive tree display, lift charts, 靈敏度分析sensitivity analysis, ROI和margin graphs, error tables和決策樹規(guī)則decision tree rules是非常直觀和可靠的。
模型能夠作為C, C++ and Java代碼導(dǎo)出,從而將customer scoring, campaign management 和real-time "intelligent agents"與企業(yè)其他應(yīng)用程序集成,比如:Call Center等。模型探索器能自動構(gòu)建多個模型,并且為用戶選擇最好的一個。工作流Workflow和scripting的特點(diǎn)提供了一個數(shù)據(jù)挖掘步驟的可視化描述和自動的數(shù)據(jù)挖掘過程。
優(yōu)點(diǎn):三個關(guān)鍵強(qiáng)勢:高度的可擴(kuò)展性,由于能夠使數(shù)據(jù)挖掘算法并行實(shí)現(xiàn),所以能夠挖掘海量數(shù)據(jù);第二,模型能夠容易導(dǎo)出,和其他應(yīng)用集成;第三是Windows風(fēng)格的客戶端易于使用。
缺點(diǎn):缺乏在數(shù)據(jù)挖掘之前對數(shù)據(jù)的可視化探索。工作流不能可視化編輯。
對數(shù)據(jù)挖掘軟件是一個挑戰(zhàn)。Two Crows公司對Darwin進(jìn)行測試,結(jié)果如左所示。
Cabletron Systems (NYSE:CS)公司是提供基于intranet網(wǎng)絡(luò)解決方案(LAN、ATM)和軟件,SPECTRUM Enterprise Manager是該公司的網(wǎng)絡(luò)管理平臺軟件,24小時收集網(wǎng)絡(luò)數(shù)據(jù):事件、警告、統(tǒng)計信息,然后上載到一個離線的數(shù)據(jù)倉庫供分析使用,由于200個左右的應(yīng)用軟件收集數(shù)據(jù),所以數(shù)據(jù)量非常大。利用Darwin發(fā)現(xiàn)各個網(wǎng)絡(luò)端口的相關(guān)性以及事件相關(guān)性,以發(fā)現(xiàn)網(wǎng)絡(luò)故障診斷模型,提高網(wǎng)絡(luò)的有效性。
Nautilus Systems, Inc.是數(shù)據(jù)倉庫和數(shù)據(jù)挖掘咨詢公司,構(gòu)建1:1的市場和客戶關(guān)系管理解決方案,針對行業(yè)包括:醫(yī)療健康、金融、電信、政府。應(yīng)用Darwin作為數(shù)據(jù)挖掘軟件。
Pilot Decision Support Suite
平臺:Windows NT
功能:基于Web的商業(yè)智能解決方案。PDSS能夠執(zhí)行時序分析,作假設(shè)(what-if)分析,通過建立地區(qū)、時間、產(chǎn)品和其他種類的維度獲得詳細(xì)的信息-多維分析工具。
優(yōu)點(diǎn):公司不僅在技術(shù)上,在商業(yè)上也有很深入的理解。報表能夠定制。
缺點(diǎn):多層次功能在第二層次上不能按條件排序。
Combe公司是家用和寵物商品的生產(chǎn)銷售商。為了理解客戶購買模型,利用PDSS作時序分析。也有利于很好地管理庫存,有助于定制生產(chǎn)計劃。利用時序分析跟蹤每年客戶購買模型的改變。
Decisionhouse
平臺:UNIX,NT
功能:Decisionhouse是一個客戶行為建模的軟件集,能夠發(fā)現(xiàn)關(guān)
Liverpool Victoria Friendly Society是一個金融協(xié)會,對2百萬個客戶提供投資、存款和保險服務(wù)。利用Decisionhouse進(jìn)行客戶關(guān)系管理,使合適的客戶購買他們需要的商品,一個結(jié)果是直接MAIL項目響應(yīng)率比原先提高了35%。
鍵的特征,比如標(biāo)記可能有defect的客戶、或者哪些客戶有較高的可能性購買特定的商品。Decisionhouse是CRM 策略的關(guān)鍵部分。功能包括:查詢、報表、數(shù)據(jù)挖掘、OLAP和可視化。Decisionhouse 將數(shù)據(jù)轉(zhuǎn)換成易于理解的3-D圖形表示。根據(jù)目標(biāo)對象(比如響應(yīng)率或預(yù)言值)可能值標(biāo)記高的和低響應(yīng)率的客戶分組和客戶定級。
通過OLAP的功能,Decisionhouse提供一種機(jī)制報告在實(shí)際的響應(yīng)之后標(biāo)記和理解詳細(xì)的行為模式的成功率和機(jī)會。功能還包括客戶分片和定位, 客戶行為的多維可視化,交叉表格報表cross-tabulated reports ,決策樹分片和響應(yīng)模型, mailing and control cell lists。
優(yōu)點(diǎn):實(shí)時、高速的客戶分片和描述。易于使用的可視化界面。
缺點(diǎn):沒有使用神經(jīng)網(wǎng)絡(luò)技術(shù),以避免黑盒問題。沒有內(nèi)置的方法協(xié)助執(zhí)行典型的分析,比如: mailing response,campaign creation. Decisionhouse創(chuàng)建了大量文件,這些文件需要專門培訓(xùn)過的人員才能熟練掌握。
C&A 是歐洲出名的零售商,成立于1841, 公司在12個歐洲國家有579個商店。C&A每年有兩個主要的direct mail campaigns。 使用Decisionhouse和Quadstone公司的應(yīng)用行業(yè)案例:咨詢,提高響應(yīng)率。目前,響應(yīng)率增加2倍左右,贏利率提高了20倍。
California San Francisco的CustomerLinx是一個基于知識的市場服務(wù)公司,提供多模式的客戶分析,包括: inbound and outbound fax, IVR and Internet response services?;诟鱾€渠道的客戶分析,為不同的行業(yè)提供以客戶為中心的市場解決方案,包括:電信、零售和電子商務(wù)。為了定位客戶獲取和流失問題customer acquisition and churn, CustomerLinx開發(fā)了客戶中心解決方案。面向客戶市場的核心是:the ability to tailor the offer, message or channel to individual customer needs, 這些需要有效的客戶分片技術(shù)。利用Decisionhouse來解決上述問題,使得CustomerLinx近來campaign response rate從0.8增長到4%。
CART Decision-Tree Suite
平臺:Windows NT,UNIX
功能:桌面型CART和Unix版本兩種。都能產(chǎn)生cut-and-paste模型的源代碼。CART能夠處理臟數(shù)據(jù)。TreeCoder 自動產(chǎn)生SAS代碼。
優(yōu)點(diǎn):精確的模型能夠迅速地開發(fā)和實(shí)施。
缺點(diǎn):分類問題涉及"yes/no"或 "A or B or C"的種類目標(biāo)變量,回歸定位連續(xù)型目標(biāo)變量,比如:花費(fèi)的金額等。CART或任何其他決策樹在回歸問題上都處理得不好。為了克服這個缺陷,Salford Systems近來開發(fā)了MARS, 一個數(shù)據(jù)挖掘工具以解決回歸問題。
American Express 是全球旅游、金融網(wǎng)絡(luò)服務(wù)提供商。利用CART進(jìn)行數(shù)據(jù)分類,構(gòu)建決策樹,以提高贏利。
Enterprise Miner
平臺:Windows NT
功能:Enterprise Miner為所有的模型開發(fā)產(chǎn)生全部的記分代碼,這些記分代碼能夠立即應(yīng)用到新的數(shù)據(jù)中。一個評
Vermont Country Store是一家面向家庭的零售公司。利用數(shù)據(jù)挖掘工具EM定位target-mail 和marketing strategy。
估工具將數(shù)據(jù)挖掘結(jié)果轉(zhuǎn)換成商業(yè)術(shù)語,結(jié)果能夠通過Web共享。SAS的數(shù)據(jù)挖掘方法論稱作SEMMA (抽樣、探索、修改、建模、評估)。SAS/EM集成了:數(shù)據(jù)獲取工具;數(shù)據(jù)取樣工具 ;數(shù)據(jù)篩選工具 ;數(shù)據(jù)變量轉(zhuǎn)換工具 ;數(shù)據(jù)挖掘數(shù)據(jù)庫 ;數(shù)據(jù)挖掘過程;多種形式的回歸工具 ;為建立決策樹的數(shù)據(jù)剖分工具;決策樹瀏覽工具;人工神經(jīng)元網(wǎng)絡(luò);數(shù)據(jù)挖掘的評價工具 。 可利用SAS/EM中具有明確代表意義的圖形化的模塊將這些數(shù)據(jù)挖掘的工具單元組成一個處理流程圖,并依此來組織用戶的數(shù)據(jù)挖掘的過程。這一過程在任何時候均可根據(jù)具體情況的需要進(jìn)行修改、更新并將適合用戶需要的模式存儲起來,以便此后重新調(diào)出來使用。
優(yōu)點(diǎn):圖形化的界面,可視化的操作,可導(dǎo)引即使是數(shù)理統(tǒng)計經(jīng)驗(yàn)不太多的使用者也能按照SEMMA的原則成功的進(jìn)行數(shù)據(jù)挖掘。對于有經(jīng)驗(yàn)的專家,SAS/EM也可讓用戶一展身手精細(xì)的調(diào)整分析處理過程。
缺點(diǎn):臨時文件花費(fèi)了許多空間,打印決策樹比較困難。
Seagate Holos
平臺:Unix,Windows,RDB,MDB
功能:將關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換成OLAP cubes,然后裝載到Seagate Holos客戶端分析??梢远ㄖ?。支持ROLAP和non-ROLAP。數(shù)據(jù)可以周期性的裝載到系統(tǒng)。有自己開發(fā)的語言,使得客戶能構(gòu)造和定制復(fù)雜的企業(yè)商業(yè)智能系統(tǒng)。
優(yōu)點(diǎn):混合的OLAP結(jié)構(gòu)
缺點(diǎn):培訓(xùn)該軟件需要時間和專業(yè)技能
應(yīng)用行業(yè)案例:Charles Schwab利用該軟件進(jìn)行多維分析,創(chuàng)建報表和模型,預(yù)測趨勢。
Data Clustering Engine
平臺:AIX,Unix
功能:產(chǎn)生ASCII文件, 可以定制開發(fā)。將輸入文件增加clustering key然后輸出, 為其標(biāo)記打分,然后產(chǎn)生報表。不管數(shù)據(jù)質(zhì)量如何,該軟件都能將記錄分組。
IBM Brazil是一個計算機(jī)公司,用IBM的產(chǎn)品構(gòu)建解決方案。使用Data Clustering Engine 將公司合同的副本轉(zhuǎn)換成外部文件,導(dǎo)入marketing系統(tǒng)的數(shù)據(jù)庫。
優(yōu)點(diǎn):易于使用
缺點(diǎn):不能訪問關(guān)系數(shù)據(jù)庫,不能執(zhí)行scrubbing.