国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
核聚類(lèi)與支持向量聚類(lèi)-郭崇慧的博客-科學(xué)網(wǎng)

聚類(lèi)是數(shù)據(jù)挖掘中用來(lái)發(fā)現(xiàn)數(shù)據(jù)分布和隱含模式的一項(xiàng)重要技術(shù)[1]。作為一種常見(jiàn)的數(shù)據(jù)分析工具和無(wú)監(jiān)督機(jī)器學(xué)習(xí)方法,聚類(lèi)的目的是把數(shù)據(jù)集合分成若干類(lèi)(或簇),使得每個(gè)類(lèi)中的數(shù)據(jù)之間最大限度地相似,而不同類(lèi)中的數(shù)據(jù)最大程度地不同。根據(jù)聚類(lèi)算法所采用的基本思想,大致可以將它們分為五種[2],即劃分聚類(lèi)、層次聚類(lèi)、基于密度的聚類(lèi)、基于網(wǎng)格的聚類(lèi)和基于模型的聚類(lèi)。目前對(duì)聚類(lèi)算法的研究正在不斷深入,其中核聚類(lèi)算法和譜聚類(lèi)算法是近年來(lái)受到廣泛關(guān)注的兩種算法[3]。

核聚類(lèi)方法的主要思想是通過(guò)一個(gè)非線(xiàn)性映射,將輸入空間中的數(shù)據(jù)點(diǎn)映射到高維特征空間中,并選取合適的Mercer核函數(shù)代替非線(xiàn)性映射的內(nèi)積,在特征空間中進(jìn)行聚類(lèi)。該方法是普適的,它比經(jīng)典的聚類(lèi)方法有較大的改進(jìn)。它通過(guò)非線(xiàn)性映射增加了數(shù)據(jù)點(diǎn)線(xiàn)性可分的概率,即能較好地分辨、提取并放大有用的特征,從而實(shí)現(xiàn)更為準(zhǔn)確的聚類(lèi),算法收斂速度也較快。在經(jīng)典聚類(lèi)算法失效的情況下,核聚類(lèi)算法常常能得到較好的聚類(lèi)結(jié)果[4]。

 支持向量聚類(lèi)(Support Vector Clustering, SVC)屬于核聚類(lèi)的一種,它以支持向量機(jī)(Support Vector Machine, SVM)為工具進(jìn)行聚類(lèi)[5]。它是Ben-Hur等在基于高斯核的SVDDSupport Vector Domain Description)算法基礎(chǔ)上進(jìn)一步發(fā)展起來(lái)的無(wú)監(jiān)督非參數(shù)型的聚類(lèi)算法[6]。它的基本思想是:利用高斯核,將數(shù)據(jù)空間中的數(shù)據(jù)點(diǎn)映射到一個(gè)高維的特征空間中。再在特征空間中尋找一個(gè)能包圍所有數(shù)據(jù)點(diǎn)象的半徑最小的球,將這個(gè)球映回到數(shù)據(jù)空間,則得到了包含所有數(shù)據(jù)點(diǎn)的等值線(xiàn)集。這些等值線(xiàn)就是簇的邊界。每一條閉合等值線(xiàn)包圍的點(diǎn)屬于同一個(gè)簇[7, 8]。SVC算法主要分為兩個(gè)階段:SVC訓(xùn)練階段和聚類(lèi)分配階段。其中SVC訓(xùn)練階段包括高斯核寬度系數(shù)的確定、核矩陣的計(jì)算、Lagrange乘子的計(jì)算、支持向量的選取和高維特征空間中特征球半徑的計(jì)算。聚類(lèi)分配階段首先生成鄰接矩陣,然后根據(jù)鄰接矩陣進(jìn)行聚類(lèi)分配[9]。

SVC算法具有兩大顯著優(yōu)勢(shì):能產(chǎn)生任意形狀的簇邊界;能分析噪聲數(shù)據(jù)點(diǎn)且能分離相互交疊的簇。這是許多聚類(lèi)算法無(wú)法做到的。但SVC算法仍存在兩個(gè)瓶頸: Lagrange乘子的計(jì)算和鄰接矩陣的計(jì)算。相對(duì)而言,后者需要消耗的計(jì)算時(shí)間遠(yuǎn)比前者多[9]。因此很多新的SVC算法都旨在提高鄰接矩陣的計(jì)算效率[10, 11]。

 

參考文獻(xiàn)

[1] Xu R, Wunsch D. Survey of Clustering Algorithms. IEEE Transaction on Neural Networks, 2005, 16(3): 645-678.

[2] Han J, Kamber M. Data Mining: Concepts and Techniques, Second Edition. Morgan Kaufmann, San Francisco, 2006.

[3] Filippone M, Camastra F, Masulli F, Rovetta S. A Survey of Kernel and Spectral Methods for Clustering. Pattern Recognition, 2008, 41(1): 176-190.

[4] 張莉,周偉達(dá),焦李成. 核聚類(lèi)算法. 計(jì)算機(jī)學(xué)報(bào), 2002, 25(6): 587-590.

[5] Burges C J C. A Tutorial on Support Vector Machines for Pattern Recognition. Data Mining and Knowledge Discovery, 1998, 2(2): 121-167.

[6] Tax D M J, Duin R P W. Support Vector Domain Description. Pattern Recognition Letters, 1999, 20(11-13): 1191-1199.

[7] Ben-Hur A, Horn D, Siegelmann H T, Vapnik V. Support Vector Clustering. Journal of Machine Learning Research, 2001, 2(12): 125-137.

[8] Scholkopf B, Williamson R, Smola A, Shawe-Taylor J, Platt J. Support Vector Method for Novelty Detection. Advances in Neural Information Processing System 12. 2000: 582-588.

[9] 呂???,姜澄宇,王寧生. 一種支持向量聚類(lèi)的快速算法. 華南理工大學(xué)學(xué)報(bào). 2005, 33(1): 6-9.

[10] Lee J, Lee D. An Improved Cluster Labeling Method for Support Vector Clustering. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2005, 27(3): 461-464.

[11] Camastra F, Verri A. A Novel Kernel Method for Clustering. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2005, 27(5):801-805.

 

本文引用地址: http://www.sciencenet.cn/m/user_content.aspx?id=252321
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶(hù)發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
Spectral Clustering(譜聚類(lèi)
經(jīng)典機(jī)器學(xué)習(xí)算法-第十五章MeanShift聚類(lèi)
Free Mind ? 漫談 Clustering (1): k
【獨(dú)家】一文讀懂聚類(lèi)算法
R語(yǔ)言譜聚類(lèi)、K-MEANS聚類(lèi)分析非線(xiàn)性環(huán)狀數(shù)據(jù)比較
機(jī)器學(xué)習(xí)各個(gè)算法的優(yōu)缺點(diǎn)!
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服