国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項超值服

開通VIP
數(shù)據(jù)挖掘聚類算法之K
(2014-07-02 14:26:11)

得前一篇博文寫過關(guān)于K-MEANS的內(nèi)容,K-MEANS顧名思義K-均值,通過計算一類記錄的均值來代表該類,但是受異常值或極端值的影響比較大,這里介紹另外一種算法K-medodis。

看起來和K-means比較相似,但是K-medoids和K-means是有區(qū)別的,不一樣的地方在于中心點的選取,在K-means中,我們將中心點取為當(dāng)前cluster中所有數(shù)據(jù)點的平均值,在K-medoids算法中,我們將從當(dāng)前cluster中選取這樣一個點——它到其他所有(當(dāng)前cluster中的)點的距離之和最小——作為中心點



K-MEANS算法的缺點:
產(chǎn)生類的大小相差不會很大,對于臟數(shù)據(jù)很敏感。
改進(jìn)的算法:K-medoids方法。

這兒選取一個對象叫做mediod來代替上面的中心的作用,這樣的一個medoid就標(biāo)識了這個類。

K-MEDODIS的具體流程如下:
1)任意選取K個對象作為medoids(O1,O2,…Oi…Ok)。  
2)將余下的對象分到各個類中去(根據(jù)與medoid最相近的原則);  
3)對于每個類(Oi)中,順序選取一個Or,計算用Or代替Oi后的消耗—E(Or)。選擇E最小的那個Or來代替Oi。這樣K個medoids就改變了。
4)重復(fù)2、3步直到K個medoids固定下來?! ?br>不容易受到那些由于誤差之類的原因產(chǎn)生的臟數(shù)據(jù)的影響,但計算量顯然要比K-means要大,一般只適合小數(shù)據(jù)量。

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
MATLAB用改進(jìn)K-Means(K-均值)聚類算法數(shù)據(jù)挖掘高校學(xué)生的期末考試成績
數(shù)據(jù)挖掘RapidMiner工具使用
【十大經(jīng)典數(shù)據(jù)挖掘算法】k
漫談 Clustering (2): k
利用R語言如何聚類
基于數(shù)據(jù)挖掘的失眠癥用藥規(guī)律研究
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服