Orange
Orange (http://www.ailab.si/orange)是類似KNIME和Weka KnowledgeFlow的數(shù)據(jù)挖掘工具,它的圖形環(huán)境稱為Orange畫布(OrangeCanvas),用戶可以在畫布上放置分析控件(widget),然后把控件連接起來即可組成挖掘流程。這里的控件和KNIME中的節(jié)點(diǎn)是類似的概念。每個控件執(zhí)行特定的功能,但與KNIME中的節(jié)點(diǎn)不同,KNIME節(jié)點(diǎn)的輸入輸出分為兩種類型(模型和數(shù)據(jù)),而Orange的控件間可以傳遞多種不同的信號,比如learners, classifiers, evaluation results, distance matrices, dendrograms等等。Orange的控件不象KNIME的節(jié)點(diǎn)分得那么細(xì),也就是說要完成同樣的分析挖掘任務(wù),在Orange里使用的控件數(shù)量可以比KNIME中的節(jié)點(diǎn)數(shù)少一些。Orange的好處是使用更簡單一些,但缺點(diǎn)是控制能力要比KNIME弱。
除了界面友好易于使用的優(yōu)點(diǎn),Orange的強(qiáng)項在于提供了大量可視化方法,可以對數(shù)據(jù)和模型進(jìn)行多種圖形化展示,并能智能搜索合適的可視化形式,支持對數(shù)據(jù)的交互式探索。
Orange的弱項在于傳統(tǒng)統(tǒng)計分析能力不強(qiáng),不支持統(tǒng)計檢驗(yàn),報表能力也有限。Orange的底層核心也是采用C++編寫,同時允許用戶使用Python腳本語言來進(jìn)行擴(kuò)展開發(fā)(參見http://www.scipy.org)。