假設(shè)一個由4個頁面組成的小團體:A,B, C 和 D。如果所有頁面都鏈向A,那么A的PR(PageRank)值將是B,C 及 D的和。
PR(A) = PR(B) + PR(C) + PR(D)
繼續(xù)假設(shè)B也有鏈接到C,并且D也有鏈接到包括A的3個頁面。一個頁面不能投票2次。所以B給每個頁面半票。以同樣的邏輯,D投出的票只有三分之一算到了A的 PageRank 上。
PR(A) =PR(B) /2+PR(C) /1+PR(D)/3
換句話說,根據(jù)鏈處總數(shù)平分一個頁面的PR值。
PR(A) =PR(B) /L(B)+PR(C) /L(C)+PR(D)/L(D)
最后,所有這些被換算為一個百分比再乘上一個系數(shù)q。由于下面的算法,沒有頁面的PageRank會是0。所以,Google通過數(shù)學(xué)系統(tǒng)給了每個頁面一個最小值1-q。
PR(A) =(PR(B) /L(B)+PR(C) /L(C)+PR(D)/L(D)+...+PR(N)/L(N))q+1-q
所以一個頁面的 PageRank 是由其他頁面的PageRank計算得到。Google 不斷的重復(fù)計算每個頁面的 PageRank。如果您給每個頁面一個隨機 PageRank 值(非0),那么經(jīng)過不斷的重復(fù)計算,這些頁面的 PR 值會趨向于正常和穩(wěn)定。這就是搜索引擎使用它的原因。
其中,PR(A):指網(wǎng)頁A的佩奇等級(PR值)
PR(B)、PR(C)...PR(N)表示鏈接網(wǎng)頁A的網(wǎng)頁N的佩奇等級(PR)。N是鏈接的總數(shù),這個鏈接可以使來自任何網(wǎng)站的導(dǎo)入鏈接(反向鏈接)。
L(N):網(wǎng)頁N往其他網(wǎng)站鏈接的數(shù)量(網(wǎng)頁N的導(dǎo)出鏈接數(shù)量)
q:阻尼系數(shù),介于0-1之間,google設(shè)為0.85.
從上面的公式我們可以看到網(wǎng)頁A的PR是由鏈接它的其他網(wǎng)頁L(N)所決定的。在網(wǎng)頁L(N)中如果有一個鏈接指向網(wǎng)頁A,那么A就得到了一個“投票氣而這個投票來自網(wǎng)上任何一張網(wǎng)頁。每個“投票”都是表示一份“支持”。越多的鏈接指向網(wǎng)頁A,網(wǎng)頁A的PR值或者等級就越高。沒有鏈接就是沒有一個網(wǎng)頁支持A。
但是不同網(wǎng)頁的PR值不同,所以不同的網(wǎng)頁給網(wǎng)頁A的投票權(quán)重是不一樣的。
完整的PR值計算方法
這個方程式引入了隨機瀏覽的概念,即有人上網(wǎng)無聊隨機打開一些頁面,點一些鏈接。一個頁面的PageRank值也影響了它被隨機瀏覽的概率。為了便于理解,這里假設(shè)上網(wǎng)者不斷點網(wǎng)頁上的鏈接,最終到了一個沒有任何鏈出頁面的網(wǎng)頁,這時候上網(wǎng)者會隨機到另外的網(wǎng)頁開始瀏覽。
為了對那些有鏈出的頁面公平,q = 0.15(q的指阻尼系數(shù))的算法被用到了所有頁面上,估算頁面可能被上網(wǎng)者放入書簽的概率。
所以,這個等式如下:

p1,p2,...,pN是被研究的頁面,M(pi)是鏈入pi頁面的數(shù)量,L(pj)是pj鏈出頁面的數(shù)量,而N是所有頁面的數(shù)量。
PageRank值是一個特殊矩陣中的特征向量。這個特征向量為

R是等式的答案

如果pj不鏈向pi, 而且對每個j都成立時,等于 0

這項技術(shù)的主要缺點是舊的頁面等級會比新頁面高。因為即使是非常好的新頁面也不會有很多上游鏈接,除非它是某個站點的子站點。
這就是PageRank需要多項算法結(jié)合的原因。Google經(jīng)常懲罰惡意提高PageRank的行為,至于其如何區(qū)分正常的鏈接交換和不正常的鏈接堆積仍然是商業(yè)機密。
但是我們始終堅持一點是,大家不要刻意的去追求PR值,因為影響排名的因素有上百種。建議網(wǎng)站設(shè)計人員可以充分認(rèn)識佩奇等級在google優(yōu)化排名中的重要作用,從設(shè)計前的考慮到后期網(wǎng)站更新都要考慮一下佩奇等級。從而很好的利用google PageRank。