關(guān)鍵字堆砌定義概述
關(guān)鍵字堆砌(keyword stuffing)是指在一個(gè)網(wǎng)頁(yè)中非常密集地放置關(guān)鍵字。一般說(shuō)來(lái),如果關(guān)鍵字的出現(xiàn)過(guò)于頻繁,就會(huì)蓋過(guò)網(wǎng)頁(yè)的其他內(nèi)容。雖然過(guò)度使用關(guān)鍵字有可能觸發(fā) Google的過(guò)濾器(filter),但更嚴(yán)重的問(wèn)題是因內(nèi)容難于閱讀而造成訪問(wèn)流量的潛在損失。如果一個(gè)搜索者發(fā)現(xiàn)在一個(gè)頁(yè)面到處都充斥著關(guān)鍵字,那么他幾乎不可能在這個(gè)頁(yè)面逗留,而且也不可能轉(zhuǎn)變成一個(gè)付費(fèi)客戶。因此由于關(guān)鍵字堆砌而造成的損失是雙重的。
常見(jiàn)形式
眾多關(guān)鍵字充斥于網(wǎng)頁(yè)信息中就會(huì)形成關(guān)鍵字堆砌(Keyword stuffing)。這類網(wǎng)頁(yè)看起來(lái)更像是一連串的關(guān)鍵字,而不像是別的什么東西。關(guān)鍵字堆砌的另一形式就是將關(guān)鍵字或關(guān)鍵詞盡可能多次的填入頁(yè)面的 title標(biāo)簽中。搜索引擎通常會(huì)降低這類網(wǎng)頁(yè)的搜索排名,或者完全忽略這些關(guān)鍵字。這兩種結(jié)果對(duì)網(wǎng)站都沒(méi)有什么好處。關(guān)鍵字堆砌的橋頁(yè)(doorway pages)或隱形頁(yè)面(cloaked pages)不僅是過(guò)度使用關(guān)鍵字的例子,而且還是因自身原因而受到懲罰的因素。在所有導(dǎo)入鏈接(inbound links)中頻繁使用相同的鏈接錨文本,也會(huì)被看作是關(guān)鍵字堆砌的一種形式。
一個(gè)網(wǎng)站是否會(huì)因?yàn)殛P(guān)鍵字堆砌而受到懲罰?
一個(gè)網(wǎng)站會(huì)因?yàn)殛P(guān)鍵字堆砌(keyword stuffing)而受到搜索引擎的懲罰。Google似乎對(duì)于頁(yè)面上過(guò)度使用關(guān)鍵字非常敏感,因?yàn)殛P(guān)鍵字堆砌會(huì)觸發(fā)過(guò)濾器(filter)。搜索引擎巨人可能對(duì)網(wǎng)站采取的懲罰措施包括,降低其在搜索結(jié)果中的排名、降低其在Google的PR值以及禁止該網(wǎng)站。如同所有搜索引擎優(yōu)化(SEO)的努力一樣,常識(shí)和考慮什么事情有益于你的網(wǎng)站瀏覽者,是任何一個(gè)站長(zhǎng)最好的行為。
搜索引擎對(duì)關(guān)鍵字堆砌的識(shí)別
概述
搜索引擎和搜索引擎優(yōu)化(SEO)一直是一對(duì)矛盾,合理的優(yōu)化有助于搜索引擎對(duì)網(wǎng)站內(nèi)容的識(shí)別,有助于網(wǎng)站的推廣。然而有正面,就有反面,一些SEOers通過(guò)各種欺騙手段來(lái)欺騙搜索引擎,以期達(dá)到增加頁(yè)面收錄數(shù)和頁(yè)面排名的目的。
早期的關(guān)鍵字堆砌SPAM作弊方式之一,是將中文詞庫(kù)中的單詞直接用軟件拼湊成文章,這樣的文章沒(méi)有實(shí)際的意義,只能給搜索引擎看。那么對(duì)于這樣的文章,搜索引擎是通過(guò)什么方式來(lái)識(shí)別的呢?
我們知道,每個(gè)搜索引擎都有網(wǎng)頁(yè)質(zhì)量監(jiān)控部門,對(duì)于百度等摻雜人工處理的搜索引擎而言,用戶發(fā)現(xiàn)這樣的網(wǎng)站,投訴到百度,百度直接封了這個(gè)網(wǎng)站了事。但對(duì)于Google這樣的封站也是自動(dòng)處理的搜索引擎而言,對(duì)關(guān)鍵字堆砌作弊的識(shí)別就顯得更為重要了。
對(duì)于關(guān)鍵字堆砌作弊方式的識(shí)別,搜索引擎一般采用統(tǒng)計(jì)分析的方法進(jìn)行。
網(wǎng)頁(yè)分詞技術(shù)
搜索引擎首先將網(wǎng)頁(yè)進(jìn)行分詞,分詞完成后可以得到詞的數(shù)量N和文章長(zhǎng)度L,從大量文章的統(tǒng)計(jì)中發(fā)現(xiàn)文章的長(zhǎng)度L和詞的數(shù)量N兩個(gè)數(shù)字之間存在一定的分布關(guān)系,一般而言L/N界于4至8之間,均值大約在5-6之間。也就是說(shuō)一篇長(zhǎng)度為1000字節(jié)的文章中,應(yīng)該有125-250個(gè)分詞,由于中文和英文的詞的組成不一致,因此在英文和中文中這個(gè)比值的范圍會(huì)有所不同。如果搜索引擎發(fā)現(xiàn)L/N特別大,那么這篇文章就存在就存在關(guān)鍵字堆砌現(xiàn)象了,如果L/N特別小,則可能是這篇文章是由一些詞所組成的沒(méi)有意義的文章。
進(jìn)一步,通過(guò)大量正常文章統(tǒng)計(jì)發(fā)現(xiàn),文章中密度最高的幾個(gè)關(guān)鍵字出現(xiàn)的次數(shù)之和與N/L存在一定的分布關(guān)系,搜索引擎就可以通過(guò)網(wǎng)頁(yè)中的分布與統(tǒng)計(jì)結(jié)果的分布圖進(jìn)行比較得出文章是否存在關(guān)鍵字堆砌的現(xiàn)象。
此外,搜索引擎還將從停止字的比例來(lái)判定文章是否為自然文章。停止字就是如“的”“我”“是”等在文章中普遍使用的字或詞,如果文章中停止字的比例在正常的比例范圍之外,這個(gè)網(wǎng)頁(yè)應(yīng)提交到網(wǎng)頁(yè)質(zhì)量監(jiān)控部門審核。
文章分析比較
當(dāng)然,還有更多的算法可以對(duì)網(wǎng)頁(yè)與自然語(yǔ)言的文章進(jìn)行比較分析,以判別文章是否為自然文章。
所謂魔高一尺、道高一丈,有些作弊者已經(jīng)放棄了單詞的組成文章的作弊方式,而改用句子組成文章的作弊方式,作弊者通過(guò)爬蟲(chóng)或其它方式獲得網(wǎng)上文章的句子,并用軟件將數(shù)十篇文章的某幾句拼湊成一篇文章。這就需要搜索引擎做語(yǔ)義的分析來(lái)判斷是否作弊了,然而目前關(guān)于語(yǔ)義分析的研究還處于研究階段,這也是下一代智能搜索引擎的方向。
然而我們?nèi)匀徊荒軐⒆詣?dòng)文章生成一棍子打死,基于人工智能的文章生成仍然是人類研究自身語(yǔ)言以及自身智能的一個(gè)重要方向。作弊與反作弊,將能促使人類對(duì)人工智能的研究。
如果到最后,軟件能生成人類能夠理解的文章,這是SPAM還是精華?你能肯定地說(shuō)目前存在的智能化程度還不夠高的RSS聚合文章一定是SPAM嗎?然而,如果這樣的文章海量的出現(xiàn),我們又該如何去面對(duì)這個(gè)現(xiàn)象?
教你如何提高
關(guān)鍵詞密度,防范關(guān)鍵字堆砌?
不可見(jiàn)“關(guān)鍵字堆砌”
不可見(jiàn)“關(guān)鍵字堆砌”的手法
1、在<input type= "hidden">表單中隱藏的關(guān)鍵詞內(nèi)容。
2、讓關(guān)鍵詞的文字顏色和它們的背景色一樣,這些關(guān)鍵詞也占了空間,雖然瀏覽者看不到,但是搜索引擎看得到。
不可見(jiàn)“關(guān)鍵詞堆砌”是一種不好的網(wǎng)上禮儀而被一些引擎懲罰。
搜索引起對(duì)不可見(jiàn)“關(guān)鍵字堆砌”的懲罰
隱藏關(guān)鍵詞的目的就是為了增加頁(yè)面關(guān)鍵詞的密度,達(dá)到優(yōu)化的效果,說(shuō)白了就是欺騙搜索引擎,現(xiàn)在的搜索引擎已經(jīng)能輕易的識(shí)別這些技術(shù),網(wǎng)站一但被搜索引擎發(fā)現(xiàn)隱藏堆砌關(guān)鍵字,輕則降權(quán)重,重則網(wǎng)站直接被K被屏蔽,建議不要使用。
關(guān)鍵字堆砌的常見(jiàn)形式
1、標(biāo)題中堆砌關(guān)鍵詞:
眾所周知,標(biāo)題是SEO中比較重要的一個(gè)部分,很多人將大量的關(guān)鍵地都堆砌在標(biāo)題中,例如“SEO-seo培訓(xùn)-SEO服務(wù)-SEO優(yōu)化-seo顧問(wèn)-SEO教程-SEO排名”,我的這種寫法算是堆砌的比較清微的,有的人甚至?xí)哑鰩资畟€(gè)類似的關(guān)鍵詞,如果將這種文字都放入標(biāo)題中,則就形成了對(duì)SEO這個(gè)詞的堆砌。建議標(biāo)題中相同關(guān)鍵詞出現(xiàn)的次數(shù)最多不要超過(guò)3次。
2、網(wǎng)頁(yè)中堆砌關(guān)鍵詞:
大家也許知道,關(guān)鍵詞的密度直接影響了這個(gè)關(guān)鍵詞在搜索引擎中的排名,關(guān)鍵詞密度越高,則說(shuō)明這個(gè)關(guān)鍵詞在該網(wǎng)頁(yè)中的重要性越大,所以SEO行業(yè)內(nèi)有個(gè)名詞叫做“關(guān)鍵詞布局”,但是黑帽seo人員,他們并不懂得如何進(jìn)行關(guān)鍵詞布局,只為了提高關(guān)鍵詞的密度,而在網(wǎng)頁(yè)中將關(guān)鍵詞亂堆一氣。
3、隱藏關(guān)鍵詞堆砌:
通過(guò)隱藏代碼、讓文字顏色和背景色一樣、
字體的大小為1字節(jié)等方式讓用戶無(wú)法看到關(guān)鍵詞,可是搜索引擎能看到,來(lái)達(dá)到既增加關(guān)鍵詞的密度,又保證了網(wǎng)站的美觀的效果。