在Google最近一次更新后,許多網(wǎng)站發(fā)現(xiàn)自己在搜索結(jié)果頁面中的排名大幅下降,很多以前能夠出現(xiàn)在第一頁的網(wǎng)頁現(xiàn)在掉到了三、四頁甚至十頁開外,針對(duì)此的討論在多家SEO論壇上很激烈。
事實(shí)上,我們自己的網(wǎng)站也出現(xiàn)了類似的現(xiàn)象,在查詢網(wǎng)站在Google補(bǔ)充結(jié)果中網(wǎng)頁數(shù)量的方法一文中曾提到過,IT技術(shù)點(diǎn)評(píng)的排名下降幅度很大,來自Google的訪問量損失了很多。雖然可能與上個(gè)月我們的服務(wù)器故障有關(guān),如googlebot不能正常索引網(wǎng)頁,導(dǎo)致部分網(wǎng)頁被放入了補(bǔ)充結(jié)果,或者Google因此降低了IT技術(shù)點(diǎn)評(píng)的信任指數(shù),但僅僅幾天的服務(wù)器故障——甚至不是完全意義的停機(jī),而只是IIS間歇性重啟——竟能觸發(fā)如此大的波動(dòng)?仍然讓人懷疑,尤其是考慮到處于同一服務(wù)器上的SEO探索與Vista天地并沒有表現(xiàn)出如此明顯的趨勢。
在很多人的分析中,提到了這可能緣于在Google最近的排名算法調(diào)整中,將原先對(duì)最終網(wǎng)頁排名影響微乎其微的Latent Semantic Indexing的權(quán)重大大提高,從筆者個(gè)人的角度看,似乎有一定道理。
那么,應(yīng)如何理解Latent Semantic Indexing?Latent Semantic Indexing怎樣影響網(wǎng)站/網(wǎng)頁在Google中的排名呢?
我們都知道,傳統(tǒng)的搜索引擎算法基于關(guān)鍵詞,——當(dāng)然,這里所說的關(guān)鍵詞,不僅僅指網(wǎng)頁中的關(guān)鍵詞,還包括鏈接Anchor Text中的關(guān)鍵詞?!阉饕嫱ㄟ^統(tǒng)計(jì)特定網(wǎng)頁中關(guān)鍵詞的位置、密度以及鏈接Anchor Text中的關(guān)鍵詞甚至URL中的關(guān)鍵詞,從而按照匹配程度給出與用戶搜索項(xiàng)相關(guān)的結(jié)果,這是之前計(jì)算機(jī)發(fā)展水平下搜索引擎對(duì)“向用戶提供所需內(nèi)容”的最接近模擬。
但是,我們必須看到,從自然語言的角度,即便不能說所有的詞(或短語),但至少大部分詞具有一詞多義的特點(diǎn),同時(shí),自然語言也具有一義多詞的特點(diǎn),這樣,搜索結(jié)果與用戶的理想值便存在很大的距離:一詞多義將導(dǎo)致基于精確匹配的搜索算法在結(jié)出的結(jié)果中包含很多并非用戶真正要查找的內(nèi)容,而一義多詞則使用得基于精確匹配的搜索算法在給出的結(jié)果中遺漏很多用戶真正要查找的內(nèi)容。
這個(gè)弊端是傳統(tǒng)的搜索引擎算法所無法克服的,畢竟,機(jī)器算法是死的,就象施州長扮演的Terminator,無法做到像人那樣理解、分析。雖然如今多家搜索引擎都在進(jìn)行自然語言方面的研究,但客觀地說,自然語言理解仍然停留在研究階段,距真正能夠使用可以信賴的地步還差得很遠(yuǎn),甚至換個(gè)角度,就算自然語言理解發(fā)展到實(shí)用階段,其效率能否可以保障還在未知之?dāng)?shù),而對(duì)搜索引擎而言,效率也是必須考慮的因素,他們也不希望需投入更多的服務(wù)器及其他網(wǎng)絡(luò)資源才能完成同樣的任務(wù),而如果讓用戶進(jìn)行一次搜索需等上半天才能看到搜索結(jié)果則無異于搜索引擎的噩夢?!?dāng)然,這僅僅針對(duì)笨笨的Google,也許國產(chǎn)搜索引擎?zhèn)ゴ蟮摹爸形姆衷~技術(shù)”已經(jīng)能夠圓滿地解決這個(gè)問題。
Latent Semantic Indexing (LSI : 隱性語義索引)便是搜索引擎試圖盡可能弱化這一弊端的可行解決方案之一。Latent Semantic Indexing通過繞開自然語言理解,以大樣本數(shù)量的統(tǒng)計(jì)分析找出不同的詞(詞組、短語)間的相關(guān)性,以使搜索結(jié)果進(jìn)一步接近于用戶真正要查找的內(nèi)容,同時(shí),也能夠保證搜索的效率。
單純從理論上看,Latent semantic indexing (隱性語義索引)的實(shí)現(xiàn)機(jī)制并不復(fù)雜,它只不過是在正常的網(wǎng)頁收錄與索引過程中增添了一個(gè)步驟:不僅僅簡單地統(tǒng)計(jì)、分析網(wǎng)頁及鏈接中的關(guān)鍵詞,還將該網(wǎng)頁與索引數(shù)據(jù)庫中其他包含相同關(guān)鍵詞或部分相同關(guān)鍵詞的網(wǎng)頁進(jìn)行比對(duì),以確定不同網(wǎng)頁間的語義相關(guān)性以及網(wǎng)頁與特定關(guān)鍵詞間的相關(guān)性,同時(shí),將具有高語義相關(guān)性的網(wǎng)頁進(jìn)行比對(duì)分析,從中找出特定網(wǎng)頁中存在關(guān)鍵詞的相關(guān)項(xiàng),即找出特定網(wǎng)頁中雖然并不存在但與其內(nèi)容相關(guān)的關(guān)鍵詞?!@段話確實(shí)比較拗口,不知道我是否表述清楚了。
當(dāng)然,具體實(shí)施的算法要復(fù)雜得多。需要注意的是,對(duì)Latent Semantic Indexing,可能大多數(shù)人注意的是其中的Semantic (語義有關(guān)的),但Latent Semantic Indexing方面的技術(shù)文檔則往往更強(qiáng)調(diào)Latent (潛在的、隱含的),而非簡單意義的語義相關(guān)。比如說對(duì)“水”一詞而言,與其語義相關(guān)的可能是“熱水”、“涼水”之類,但潛在相關(guān)的則可以是“蒸汽”、“冰”等,這里有很大區(qū)別。
搜索引擎具體怎樣完成類似的計(jì)算不是我們所關(guān)心的,但可以明顯看出,雖然搜索引擎本身并不知道某個(gè)詞究竟代表什么,不知道某個(gè)詞是什么意思,但通過Latent Semantic Indexing算法,與單純的關(guān)鍵詞匹配相比,搜索引擎能夠以一種更準(zhǔn)確的方式判斷特定網(wǎng)頁中內(nèi)容與搜索項(xiàng)間的相關(guān)性,從而給出用戶要尋找的內(nèi)容,甚至從某種角度上看,更接近于“人”分析、查找內(nèi)容時(shí)的判斷方式。
一般認(rèn)為,Google最先將Latent Semantic Indexing(隱性語義索引)用于其AdWords/AdSense廣告系統(tǒng),用于分析特定網(wǎng)頁與廣告之間的相關(guān)性,從而將最具有文本相關(guān)性的廣告投放到特定網(wǎng)頁上。隨后才將其引入到排名算法中,不過,在最初的時(shí)候,其權(quán)重很小,在去年開始的Jagger與BigDaddy更新中逐步提升其權(quán)重。
究其原因,也許是因?yàn)樽畛醯腖atent Semantic Indexing(隱性語義索引)算法并不完善,用于Adsense固然可以但若用于排名則會(huì)出現(xiàn)問題,而隨著算法的不斷改進(jìn)才在排名算法中逐步提高它的影響。畢竟,Latent Semantic Indexing只是電腦進(jìn)行的模擬,而不是真正意義上的自然語言分析,其結(jié)果仍與搜索引擎的目標(biāo)存在距離。
需要再次強(qiáng)調(diào)的是,Latent Semantic Indexing(隱性語義索引)只是目前搜索引擎排名算法中關(guān)鍵詞匹配技術(shù)的補(bǔ)充,從樂觀的角度甚至可以說是非常有意義的補(bǔ)充,但絕不是取代現(xiàn)有的關(guān)鍵詞匹配算法。
這需要從兩個(gè)方面看,首先,引入Latent semantic indexing (隱性語義索引)及提高其權(quán)重,將會(huì)降低部分網(wǎng)頁在SERP中的排名,特別是那些針對(duì)特定關(guān)鍵詞但未涉及與其“語義相關(guān)”或“潛在”關(guān)鍵詞的網(wǎng)頁,這樣,一個(gè)之前優(yōu)化良好,如具有最佳的關(guān)鍵詞密度等,在純粹的關(guān)鍵詞匹配算法中排名領(lǐng)先的網(wǎng)頁可能會(huì)搜索結(jié)果頁面的前幾頁徹底消失。
其次,同樣的影響還存在于鏈接Anchor Text中,如果一個(gè)網(wǎng)站/網(wǎng)頁反相鏈接的Anchor Text大都使用同樣的關(guān)鍵詞,鏈接自身應(yīng)有的價(jià)值會(huì)大幅縮水。
應(yīng)該說,從IT技術(shù)點(diǎn)評(píng)的具體情況看,尤其是將其與SEO探索相比,個(gè)人感覺將最近的排名下降歸結(jié)到Latent Semantic Indexing(隱性語義索引)權(quán)重提高的影響,還是有一定道理的。——具體分析在此從略。
那么,應(yīng)如何應(yīng)對(duì)Latent Semantic Indexing(隱性語義索引)呢?
老實(shí)說,這里給出的只能是根據(jù)上述介紹而得出的分析,或者說臆測,是否可行有待驗(yàn)證。
首先,要保證網(wǎng)站的排名,需要為核心關(guān)鍵詞選定一系列的周邊關(guān)鍵詞,就象很多企業(yè)注冊(cè)域名(或商標(biāo))時(shí)除要使用的域名(或商標(biāo))外還要注冊(cè)一批保護(hù)域名(或商標(biāo))那樣,以更有效地保護(hù)核心關(guān)鍵詞,同時(shí),將周邊關(guān)鍵詞恰當(dāng)?shù)胤湃胂鄳?yīng)網(wǎng)頁內(nèi),或者針對(duì)這些周邊關(guān)鍵詞建立相應(yīng)的內(nèi)容。當(dāng)然,這些周邊關(guān)鍵詞需與核心關(guān)鍵詞語義相關(guān)或具有一定程度上的聯(lián)系。
其次,適當(dāng)變換反相鏈接的Anchor Text,不僅要讓核心關(guān)鍵詞出現(xiàn)在Anchor Text中,也要保證周邊關(guān)鍵詞在Anchor Text中出現(xiàn)的頻率。那種反相鏈接關(guān)鍵詞統(tǒng)統(tǒng)使用網(wǎng)站名稱或核心關(guān)鍵詞的作法是不可取的。
聯(lián)系客服