盡管我們在去年8月就知道Google要上馬Caffeine網(wǎng)頁索引系統(tǒng)了,但是Google官方今天才正式宣布。Caffeine系統(tǒng)可提供比以前多一半的新的索引結(jié)果,也就是說Google可以收集到比以前更多的信息,而且Caffeine的索引速度比以前更快,它也是Google實時搜索可以實現(xiàn)的重要元素。
實際上當你在Google進行搜索的時候,Google并不是在做實時搜索,而是搜索Google之前已經(jīng)索引到的存放在數(shù)據(jù)庫里的內(nèi)容,隨著網(wǎng)絡的進化,內(nèi)容極大的豐富,不僅是數(shù)量上的增加,還包括更豐富的形式,比如視頻、圖片、新聞、實時更新等等,而且人們對搜索引擎的期待越來越高,他們希望找到最新的最相關(guān)的信息,內(nèi)容發(fā)布商則希望他們前腳發(fā)出的內(nèi)容,后腳就可以在Google搜索到。
為了趕上網(wǎng)絡的進化和人們的期望,Google祭出了Caffeine,上圖顯示了老式索引系統(tǒng)和Caffeine索引系統(tǒng)的區(qū)別。老系統(tǒng)有多個層,一些是最新的內(nèi)容而其它則是較老的內(nèi)容,但大多數(shù)的層需要幾周才會更新一次。為了更新一個老的索引層,Google需要重新將整個網(wǎng)絡分析一遍才可以,所以不能保證讓你看到最新的內(nèi)容。
而有了Caffeine,Google可以在很短的周期里就分析一遍網(wǎng)絡,并更新索引庫。而且Google可以做到只要一發(fā)現(xiàn)新的網(wǎng)頁、網(wǎng)頁里新的信息就立即將它們加入到索引庫里,它們立刻就會被你搜索到。
Google還透露說,Caffeine每一秒可以并行處理成百上千個頁面,如果將這些網(wǎng)頁都打印出來,堆在一起能達到3英里厚。Caffeine每天會在單個數(shù)據(jù)庫里增加將近1億GB的新數(shù)據(jù),你需要62萬5千個最大的iPod才能存的下這些信息,如果將這些iPod連起來能排出40英里。
Via Google Blog
musiXboy 發(fā)表于 谷奧——探尋谷歌的奧秘 ( http://www.google.org.cn ), 2010. | 9 條評論 | 永久鏈接 | 關(guān)于谷奧 | 投稿/爆料
Post tags: Caffeine, Google Search, Real Time Search
歡迎訂閱谷安子站,關(guān)注Android新聞,技巧及更多