国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
有關(guān)協(xié)同過(guò)濾的總結(jié)

1 基于用戶的最近鄰?fù)扑]:

主要思想:找出與當(dāng)前用戶有相似偏好的其他用戶,即對(duì)等用戶或最近鄰,然后對(duì)當(dāng)前用戶沒有見過(guò)的產(chǎn)品P,利用其近鄰對(duì)p的評(píng)分計(jì)算預(yù)測(cè)值。

     注意:相似偏好是指對(duì)物品的評(píng)分偏好,而不是相似個(gè)人資料的用戶。

對(duì)于具有相似偏好的用戶集,采用Pearson相關(guān)系數(shù),給定評(píng)分矩陣R,用戶a和用戶b的相似度sim(a,b)的求法是對(duì)【(用戶a對(duì)產(chǎn)品pn的評(píng)價(jià)與用戶a的平均評(píng)分之差)乘以(用戶b對(duì)產(chǎn)品pn的評(píng)價(jià)與用戶b的平均評(píng)分之差)的積】求和(一共P個(gè)產(chǎn)品),再除以【(用戶a對(duì)產(chǎn)品pn的評(píng)價(jià)與用戶a的平均評(píng)分之差)的平方的求和】的平方根與【(用戶b對(duì)產(chǎn)品pn的評(píng)價(jià)與用戶b的平均評(píng)分之差)的平方的求和】的平方根。(如果你沒有看懂,請(qǐng)百度之......)。

pearson相關(guān)系數(shù)取值從+1(強(qiáng)正相關(guān))到-1(強(qiáng)負(fù)相關(guān))。

求完相似度,再根據(jù)最相似的N個(gè)近鄰與用戶a的平均評(píng)分的偏差,計(jì)算用戶a對(duì)物品p的預(yù)測(cè)值:a的平均評(píng)分加上,【近鄰b對(duì)產(chǎn)品p的評(píng)分與b的平均評(píng)分之差與相似度的積】求和(一共N個(gè)近鄰)再除以N個(gè)相似度之和。(具體的公式請(qǐng)百度之......)

在這里,P個(gè)產(chǎn)品和N個(gè)近鄰如何確定?沒有一個(gè)確定值,有研究表示,N在20到50之間比較合理。

2 基于物品的最近鄰?fù)扑]:

主要思想:利用物品間的相似度。注意:物品的相似度依然是其他用戶對(duì)其評(píng)分的相似度,不是物品名字屬性什么的相似度。

對(duì)于具有相似物品的集,采用余弦相似度,對(duì)于評(píng)分向量,點(diǎn)積除以模的積,相似度介于0和1之間,越接近1則表示越相似。但是基本的預(yù)先方法不會(huì)考慮用戶評(píng)分平均值之間的差異。改進(jìn)版的余弦方法可以解決這個(gè)問題,像pearson方法一樣,在評(píng)分之中減去平均值。

相似度求完,再求N個(gè)(產(chǎn)品的相似度乘以該用戶對(duì)產(chǎn)品的評(píng)分)之和再除以N個(gè)產(chǎn)品相似度之和。(看不懂請(qǐng)百度之公式......)

對(duì)于大規(guī)模電子商務(wù)網(wǎng)站,他們通常選擇離線預(yù)計(jì)算數(shù)據(jù):其想法是事先構(gòu)建一個(gè)物品相似度矩陣,描述所有物品兩兩之間的相似度。

3  基于圖的方法:

主要思想:利用假定用戶品味的“傳遞性”,并由此增強(qiáng)額外信息矩陣。

該方法用于評(píng)分矩陣稀疏的時(shí)候,在物品和用戶之間連線,沒有評(píng)分則不連,標(biāo)準(zhǔn)的協(xié)同過(guò)濾方法會(huì)選擇距離為3的物品,但是這種思路會(huì)考慮5步距離或者更長(zhǎng)的距離的物品。

4 矩陣因子分解:

主要思想:使用矩陣因子分解方法從評(píng)分模式抽取出一組潛在的(隱藏的)因子,并通過(guò)這些因子向量描述用戶和物品。

主要使用奇異值分解(SVD)方法發(fā)現(xiàn)文檔中的潛在因子,SVD將高度相關(guān)且在一起出現(xiàn)的詞語(yǔ)作為單獨(dú)因子,把通常很大的文檔向量矩陣拆解成更小階的近似矩陣。

SVD的原理可以通俗的表述為:將給定M分解成3個(gè)矩陣的乘積,其中U和V分別成為左、右奇異向量,A對(duì)角線上的值成為奇異值,即M=UAV T   。

5 主成分分析:

主要思想:用主成分分析對(duì)評(píng)分?jǐn)?shù)據(jù)預(yù)處理,過(guò)濾得出數(shù)據(jù)中“最重要”的方面,以解釋大多數(shù)變量。

4和5都是降維方法,數(shù)學(xué)基礎(chǔ)不太好的人很難搞懂,嗯,有待進(jìn)一步研究......

6 關(guān)聯(lián)規(guī)則挖掘:

關(guān)聯(lián)規(guī)則X=>Y表示只要交易T包含X里的元素(規(guī)則體),Y里的元素(規(guī)則頭)就非常有可能也是相同交易的元素。關(guān)聯(lián)規(guī)則的衡量標(biāo)準(zhǔn)是支持度和可信度,支持度=交易量包含X交Y的集合/交易量集合,可信度=交易量包含X交Y的集合/交易量包含X的集合。支持度和可信度的最低閾值一般需要根據(jù)經(jīng)驗(yàn)確定。

主要方法,線下計(jì)算足夠高可信度和支持度的關(guān)聯(lián)規(guī)則集合。對(duì)物品根據(jù)規(guī)則進(jìn)行可信度排序,如果有多條規(guī)則推薦一個(gè)物品,則取可信度最高的那條規(guī)則。然后返回不同物品的規(guī)則列表中最前的N個(gè)元素。有一種搜尋規(guī)則的挖掘算法利用領(lǐng)域特性專門搜尋規(guī)則頭中(即Y中)包含某種目標(biāo)物品(用戶或物品)的規(guī)則。該算法不僅提高算法的效率,而且能夠發(fā)現(xiàn)很少購(gòu)買物品的規(guī)則,這些物品可能會(huì)因?yàn)橛邢薜闹С侄仍谌炙阉鲿r(shí)被過(guò)濾掉。

7 基于概率分析的推薦方法:

用概率的方法實(shí)現(xiàn)協(xié)同過(guò)濾,最初非常簡(jiǎn)單的方法是將預(yù)測(cè)問題看成是分類問題。提到概率方法的分類問題,不得不提貝葉斯分類器了。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
使用深度學(xué)習(xí)來(lái)做推薦系統(tǒng),舉個(gè)例子給你看
手工藝品電商平臺(tái)Etsy的個(gè)性化推薦
推薦系統(tǒng):協(xié)同過(guò)濾 之 User
算法模型案例分析:通過(guò)簡(jiǎn)單的Hadoop解決并行算法
信息過(guò)載的大數(shù)據(jù)時(shí)代,大數(shù)據(jù)推薦系統(tǒng)如何搭建,趨勢(shì)何方
AI | 推薦系統(tǒng)之協(xié)同過(guò)濾的前世今生
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服