1、正視google sitemap的作用
sitemap推出的初衷是為了讓spider更容易,更快地抓取到深層次的或者隱藏的網(wǎng)頁(yè),也就是讓你的網(wǎng)站便于被搜索引擎收錄,從這個(gè)意義上 說(shuō),sitemap對(duì)于排名的直接影響是不存在的,而對(duì)于站點(diǎn)結(jié)構(gòu)清晰的網(wǎng)站,這個(gè)頁(yè)面的意義也并非那么大,因?yàn)槿绻军c(diǎn)結(jié)構(gòu)清晰,spider可以輕松 地抓取網(wǎng)頁(yè)。google也提到了:
請(qǐng)注意 Sitemaps 協(xié)議補(bǔ)充而不是取代搜索引擎已用來(lái)發(fā)現(xiàn)網(wǎng)址的基于抓取的機(jī)制。通過(guò)向搜索引擎提交一個(gè) Sitemaps(或多個(gè) Sitemaps),可幫助搜索引擎更好地抓取您的網(wǎng)站。
使用此協(xié)議并不能保證搜索索引中將包含您的網(wǎng)頁(yè)。(請(qǐng)注意,使用此協(xié)議不會(huì)影響 Google 對(duì)您網(wǎng)頁(yè)進(jìn)行排名的方式。)
2.Google SiteMap文件生成后格式
http://www.seotest.cn
2005-06-03T04:20-08:00
always
1.0
http://www.baihongtea.com/about.html
2011-03-02T20:20:36Z
daily
0.8
XML標(biāo)簽
changefreq:頁(yè)面內(nèi)容更新頻率。
lastmod:頁(yè)面最后修改時(shí)間
loc:頁(yè)面永久鏈接地址
priority:相對(duì)于其他頁(yè)面的優(yōu)先權(quán)
url:相對(duì)于前4個(gè)標(biāo)簽的父標(biāo)簽
urlset:相對(duì)于前5個(gè)標(biāo)簽的父標(biāo)簽
我將一句一句分解講解這個(gè)xml文件的每一個(gè)標(biāo)簽:
這一行定義了此xml文件的命名空間,相當(dāng)于網(wǎng)頁(yè)文件中的標(biāo)簽一樣的作用
這是具體某一個(gè)鏈接的定義入口,你所希望展示在SiteMap文件中的每一個(gè)鏈接都要用和包含在里面,這是必須的。
http://www.baihongtea.com
用描述出具體的鏈接地址
2011-03-03T04:20:32-08:00
是用來(lái)指定該鏈接的最后更新時(shí)間,這個(gè)很重要。Google的機(jī)器人會(huì)在索引此鏈接前先和上次索引記錄的最后更新時(shí)間進(jìn)行比較,如果時(shí)間一樣就會(huì)跳過(guò)不再索引。所以如果你的鏈接內(nèi)容基于上次Google索引時(shí)的內(nèi)容有所改變,應(yīng)該更新該時(shí)間,讓Google下次索引時(shí)會(huì)重新對(duì)該鏈接內(nèi)容進(jìn)行分析和提取關(guān)鍵字。這里必須用ISO 8601中指定的時(shí)間格式進(jìn)行描述,格式化的時(shí)間格式如下:
always
用這個(gè)標(biāo)簽告訴Google此鏈接可能會(huì)出現(xiàn)的更新頻率,比如首頁(yè)肯定就要用always(經(jīng)常),而對(duì)于很久前的鏈接或者不再更新內(nèi)容的鏈接就可以用yearly(每年)。這里可以用來(lái)描述的單詞共這幾個(gè):"always", "hourly", "daily", "weekly", "monthly", "yearly",具體含義我就不用解釋了吧,光看單詞的意思就明白了。
1.0
是用來(lái)指定此鏈接相對(duì)于其他鏈接的優(yōu)先權(quán)比值,此值定于0.0 - 1.0之間
還有和,這兩個(gè)就是來(lái)關(guān)閉xml標(biāo)簽的,這和HTML中的和是一個(gè)道理
另外需要注意的是,這個(gè)xml文件必須是utf-8的編碼格式,不管你是手動(dòng)生成還是通過(guò)代碼生成,建議最好檢查一下xml文件是否是utf-8編碼,最簡(jiǎn)單的方法就是用記事本打開(kāi)xml然后另存為時(shí)選擇編碼(或轉(zhuǎn)換器)為UTF-8。
登陸Google提交你的SiteMap文件,讓Google開(kāi)始爬行吧打開(kāi)http://www.google.com/webmasters/sitemaps/鏈接,如果還沒(méi)有注冊(cè)或者登陸Google,就先用自己的賬號(hào)登陸Google,登陸后轉(zhuǎn)到Y(jié)our Sitemaps狀態(tài)頁(yè)面,可以點(diǎn)擊那個(gè)Add a Sitemap + 跳轉(zhuǎn)到提交頁(yè)面進(jìn)行Sitemap文件的提交。建議文件放在你的站點(diǎn)根目錄下。給Google提交你的Sitemap URL后可以看見(jiàn)在列表里已存在,不過(guò)這時(shí)候還沒(méi)有生效,必須過(guò)幾個(gè)小時(shí)后Status欄變成OK表示正式生效,如果不是OK,可以查看Google給出的狀態(tài)標(biāo)示解釋看看是什么原因。
3、Sitemap的使用和登陸google
a.打開(kāi)瀏覽器輸入網(wǎng)址http://www.google.cn ,點(diǎn)擊右上角的登陸,用自己的google帳戶登陸,還沒(méi)有 Google 帳戶? 現(xiàn)在就創(chuàng)建一個(gè)帳戶 ,注冊(cè)帳戶以后然后登陸帳戶
b.登陸成功以后,點(diǎn)擊進(jìn)入用戶管理中心,然后點(diǎn)擊:網(wǎng)站管理員工具
c.首先添加你的網(wǎng)址例如http://www.baihongtea.com ,添加成功以后,在網(wǎng)址的對(duì)應(yīng)項(xiàng)后面點(diǎn)擊添加,打開(kāi)sitemap的添加頁(yè)面,選擇下拉菜單,選擇普通網(wǎng)站地圖,下面出現(xiàn)文本表單,在空白表單后面添加sitemap.xml,然后點(diǎn)擊提交。
d.好了!sitemap提交成功,等待5個(gè)小時(shí)之內(nèi)google收錄你的網(wǎng)站!
4、如何向google提交多個(gè)sitemap
了解關(guān)于google sitemap的基本知識(shí)
a.單個(gè)sitemap文件不能包括超過(guò)50000個(gè)URL;
b.單個(gè)sitemap文件大小不能超過(guò)10M;
c.單個(gè)管理員帳戶向google提交的sitemaps不能超過(guò)500個(gè);
d.Sitemap中不能包含更高目錄的URL;
e.一個(gè)sitemap中可以索引多個(gè)sitemaps;
f.Sitemap 索引文件最多可列出 1,000 個(gè) Sitemap;
g.網(wǎng)站中共有多少個(gè)URL,大致是如何分布的;
h.Sitemap 的URL名稱為:sitemap.xml;
i.sitemap索引的URL名稱為:sitemap_index.xml;
1)、文件較多怎么辦。
如果網(wǎng)站有幾百萬(wàn)頁(yè)面,顯然包含到同一個(gè)sitemap文件是不適合的,單一的sitemap文件建議控制在5萬(wàn)個(gè)url以下,因此你可以創(chuàng)建多個(gè) sitemap文件,例如 s1.xml,s2.xml,s3.xml……s36458.xml ,然后,創(chuàng)建一個(gè)“sitemap索引文件”,將這個(gè)文件作為你的主要sitemap,這樣spider會(huì)根據(jù)這個(gè)索引文件抓取你所有的sitemap文 件,格式如下:
http://www.baihongtea.com/s1.xml
2004-10-01T18:23:17+00:00
http://www.baihongtea.com/s2.xml
2005-01-01
……
http://www.baihongtea.com/s36458.xml
2005-01-01
2)、那種sitemap生成器比較好。
事實(shí)上,為了達(dá)到更好的效果,不建議使用sitemap生成器來(lái)創(chuàng)建sitemap,我們來(lái)看這樣一個(gè)sitemap,請(qǐng)注意紅色的字體
http://www.baihongtea.com/
2009-01-01
monthly
1
http://www.baihongtea.com/about.html
2009-01-01
monthly
0.8
http://www.baihongtea.com/product.html
2009-01-01
monthly
0.6
sitemap其實(shí)就是一個(gè)網(wǎng)址列表,和rss不同的是,spider可以直接從網(wǎng)頁(yè)獲得的 title,keyword都摒棄了,只留下基本的url,更新時(shí)間(lastmod),以及2個(gè)特地加上去的屬性changefreq(更新頻率)以及 priority(權(quán)重),雖然這里的權(quán)重是相對(duì)值(例如上文的第一個(gè)url,權(quán)重1是和其他url相比的,第二個(gè)url權(quán)重0.8也是同本站的頁(yè)面相比 而言,比第一個(gè)要低,但是比第三個(gè)url要高),并不會(huì)影響到和其他網(wǎng)站的排名,但是這個(gè)屬性有利于讓spider清楚你的網(wǎng)站頁(yè)面的重要程度,間接地影 響這些頁(yè)面的排名,而使用sitemap生成器的話,你的網(wǎng)站所有頁(yè)面都會(huì)被標(biāo)示成權(quán)重是1,這就給spider的判斷帶來(lái)麻煩,搞平均主義的話,重要和 不重要的頁(yè)面都同樣難以獲得排名,因此建議自己手寫(xiě),實(shí)在要使用sitemap生成器也應(yīng)該手工設(shè)定一些重要頁(yè)面的權(quán)重。
聯(lián)系客服