文/王利明
毫無疑問,作為搜索引擎的巨頭,Google在行業(yè)的影響力是勿庸置疑的,然而在中文數(shù)字世界里,Google卻與中國人的傳統(tǒng)思維明顯不同,因為它畢竟是外來的搜索引擎,而且是來自于一個熱衷于發(fā)展技術(shù)的劇烈膨脹的公司,所以 Google在中國正越來越多地暴露了它水土不服的問題。
新春無線大放送 全獨棟 準現(xiàn)房
個人投資項目推薦 網(wǎng)上營銷成就無限
Google技術(shù)原理的弊端
Google區(qū)別于其他搜索引擎的一大特點就是其獨特的排名算法,Google采用的算法與眾不同,并因此擁有專利。其簡單的依據(jù)就是如果一個網(wǎng)站很有價值,那么其他網(wǎng)站會紛紛和這個網(wǎng)站做鏈接。Google以此為基礎(chǔ)完善了他的搜索排名方法。而此算法也有個名字叫“Page Rank”。 不可否認這種算法很大程度上體現(xiàn)了各網(wǎng)站的重要性,但同時也帶來網(wǎng)絡(luò)欺騙的問題。
為了追求排名、為了在Google上得到第一或者首頁的顯示,最好的辦法就是增加鏈接,互相之間交換鏈接或者設(shè)置鏈接上的欺騙。Google雖然采用了很多方法去保護其算法,以便使其能夠準確地反映出網(wǎng)站的價值。但是這樣就陷入了一個惡性循環(huán),網(wǎng)站的制作者為了追求較高的知名度,其價值的追求可能會發(fā)生偏離,也就是說他們會將網(wǎng)站的重心放在增加鏈接上,而不再是網(wǎng)站的內(nèi)容、生動感和獨創(chuàng)性。換句話說,一個內(nèi)容優(yōu)秀卻無太多鏈接的網(wǎng)站將很難被Google發(fā)現(xiàn)。至今,仍未見到Google在這方面提出有效的解決辦法或思路。
不僅如此,Google在搜索工具方面也存在著嚴重隱患。2005年8月計算機世界網(wǎng)一篇題為《Google搜索工具存在嚴重隱患成為黑客幫兇》的文章指出:沒有安全保護的Web界面可以使黑客控制大量的家用電子產(chǎn)品,包括家庭網(wǎng)絡(luò)、PBX企業(yè)電話系統(tǒng)、路由器、Web攝像機以及網(wǎng)站等。上述所有的產(chǎn)品都可以通過Google進行滲透。通過整合Google查詢信息和文本處理工具,黑客可以獲得SQL口令,甚至是SQL的錯誤信息。黑客然后就可以發(fā)動所謂的SQL注入式攻擊,這種攻擊活動可以在SQL數(shù)據(jù)庫上運行未授權(quán)的命令。而且近年來不斷有黑客程序利用Google制造病毒威脅互聯(lián)網(wǎng)的安全。2004年國外流行一種能夠攻擊BBS的新蠕蟲,稱號為Santy,它利用了phpBB程序的漏洞,可以通過Google搜索鑒別出潛在的攻擊目標。蠕蟲Santy先向Google發(fā)送一個搜索請求,以獲得含有漏洞的網(wǎng)站地址。接著,Santy借助這份網(wǎng)站地址列表,發(fā)送一個PHP請求來利用網(wǎng)站phpBB軟件的漏洞,就能瘋狂傳播。截至2004年,將近40000網(wǎng)站已被Santy感染。在2005年,尋找免費“星球大戰(zhàn)”游戲的用戶可能會發(fā)現(xiàn)他們安裝了一種新的蠕蟲病毒,使得他們可能得到虛假的Google搜索結(jié)果。名為P2Load.A的這一蠕蟲在Shareaza、Imesh等 P2P網(wǎng)絡(luò)上傳播,當(dāng)蠕蟲安裝后,它就會修改計算機瀏覽器的設(shè)置,任何企圖訪問Google搜索引擎的用戶會看到一個與Google外觀相似的網(wǎng)頁,該網(wǎng)頁實際上被托管在德國的一臺服務(wù)器上。即使在輸入Google的網(wǎng)址是出現(xiàn)了拼寫錯誤,用戶也會被引導(dǎo)到虛假的網(wǎng)站上。
Google的信任危機
除了上述一些技術(shù)上的弊端,目前Google還面臨著嚴重的信任危機。
從2005年3月開始,Google開始大規(guī)模清理所謂中文作弊網(wǎng)站,兩個月內(nèi),波及上千家中文網(wǎng)站。Google出于維護用戶利益的考慮對中文網(wǎng)頁內(nèi)容進行重新評估,這對中國網(wǎng)民來說似乎是好事,因為作弊網(wǎng)站帶給用戶的往往是較差的體驗。然而很多優(yōu)秀的中文網(wǎng)站卻也因此受到無辜的牽連。如果Google針對中文網(wǎng)站的封殺作弊行動是在一種可預(yù)期的有序機制下進行,用戶或許還能接受,但是在這次大規(guī)模清理中,Google采取的這種過于武斷的處理方式開始令用戶失去對它的信任。
最近關(guān)于“寶馬”被Google封殺的新聞被炒得沸沸揚揚,Google的一位發(fā)言人表示:“我們不能容忍企圖操縱搜索結(jié)果的網(wǎng)站,因為我們的目標是向用戶提供相關(guān)的客觀搜索結(jié)果?!边@雖然符合Google一貫堅持的“不作惡”原則,但在Google按照自己內(nèi)部法則懲處違規(guī)者時,一個更為重要的問題也出來了:誰來監(jiān)管Google?換句話說,當(dāng)Google利用強大的技術(shù)能力成為信息的集權(quán)者,那么又由誰來監(jiān)督Google,使其真正能堅守“不作惡”原則呢?迄今為止,無論是國際還是國內(nèi),這個問題都沒有相關(guān)的商業(yè)行規(guī)或法律法規(guī)來解答。用戶使用Google,規(guī)則由Google自己說了算,而所謂的“監(jiān)管裁決”者同樣也是Google自己,如此一來,所謂的公正也就無從談起。
Google新技術(shù)的隱憂
Google作為搜索巨頭有著巨大的技術(shù)優(yōu)勢。Google的創(chuàng)新不是一次兩次,而是源源不斷的。確切的說,是Google成功地建立起了一個創(chuàng)新的體制,才會有這么多不斷的創(chuàng)新產(chǎn)生。Google允許員工自由支配20%的工作時間,研究自己感興趣的項目,很顯然這種機制極大地刺激了技術(shù)的創(chuàng)新,但從近年Google所推出的新產(chǎn)品的市場反饋來看,Google在其新產(chǎn)品的推廣上顯得有些過于草率。
Google于今年2月9日發(fā)布一款名為Google Desktop 3的產(chǎn)品,其中包括一項可以讓用戶跨多臺計算機搜索文件的可選項功能。為了做到這一點,這一應(yīng)用軟件將會自動地將文件的拷貝在Google公司服務(wù)器上存儲長達一個月。文件的拷貝可以從Google公司服務(wù)器上傳輸?shù)接脩舻钠渌嬎銠C上作為存檔。據(jù)Gartner公司的一份報告稱,數(shù)據(jù)在企業(yè)外部傳輸對于許多企業(yè)而言都是一種不可接受的安全漏洞,這是因為作為企業(yè)的知識產(chǎn)權(quán)可能會被泄露出去。對此,Google公司也表示承認。
同樣的問題也出現(xiàn)在Gmail上,Google在推出Gmail電子郵件服務(wù)不久就被發(fā)現(xiàn)格式不恰當(dāng)?shù)碾娮余]件地址能夠讓Gmail用戶獲得Google服務(wù)器處理的HTML格式的電子郵件內(nèi)容。這個結(jié)果將破壞Gmail通信的隱私,黑客很容易獲得用戶的電子郵件內(nèi)容和電子郵件地址等信息。盡管隨后Google承認了這個問題,并表示這個問題已經(jīng)修復(fù),但由此暴露的問題卻不得不令人擔(dān)憂。
另外,Google推出的“Google地球”自推出以后就備受爭議,一方面,它可以為廣大用戶提供便捷的服務(wù),讓用戶無論身在何處,都可以借助衛(wèi)星成像輕松找到住所和企業(yè)的所在位置,查看自己的出行路線;但另一方面,該服務(wù)也將許多國家的政府大樓、軍事設(shè)施以及一些敏感地點曝光出來,很容易被恐怖分子利用,所以引起了許多國家的擔(dān)憂和警惕。人們擔(dān)心這樣會導(dǎo)致自己的隱私權(quán)受到侵犯,而更害怕這些詳細的地理信息可能被恐怖組織利用,進而再發(fā)動類似“9·11”事件的恐怖攻擊。Google地球服務(wù)引起了許多國家的擔(dān)心,除了以色列,印度、韓國、泰國和俄羅斯等國也相繼對Google地球服務(wù)發(fā)出警告,理由是擔(dān)心這一服務(wù)會泄露國家機密。
隨著Google中國開始在大陸推廣,包括上述產(chǎn)品在內(nèi)的服務(wù)不斷的“中國化”,種種爭議和安全問題也必將帶入中國。
Google意識形態(tài)水土不服
Google進入中國市場,需要面臨的不僅僅是中文搜索等技術(shù)問題,更需要研究的是中國的文化以及中國網(wǎng)民的上網(wǎng)習(xí)慣。Google之所以能迅速發(fā)展為英文搜索的巨頭,除了其領(lǐng)先的技術(shù)優(yōu)勢,更得利于其符合西方用戶的上網(wǎng)習(xí)慣。那么Google是否符合中國的需求呢?
簡單列舉兩個事件:
其一,2005年,由于有人使用了“Google炸彈 (googlebombing)”技術(shù)惡作劇,結(jié)果使得在Google搜索關(guān)鍵詞“失敗”時會出現(xiàn)美國總統(tǒng)布什的簡介,如果用戶在Google輸入 “failure(失敗)”一詞進行搜索,就會發(fā)現(xiàn)白宮網(wǎng)站的布什簡歷出現(xiàn)在搜索結(jié)果的第一位。Google公司表示,雖然Google一貫打擊 Google炸彈的使用,但是該公司并不打算取消這些鏈接以改變搜索結(jié)果。
其二,美國政府今年1月份要求聯(lián)邦法庭責(zé)令Google開放其數(shù)據(jù)庫內(nèi)的大范圍數(shù)據(jù)。美國政府認為需要Google的數(shù)據(jù)來確定色情網(wǎng)站在網(wǎng)絡(luò)搜索引擎中出現(xiàn)的頻率,以復(fù)興兩年前美國最高法院曾發(fā)起一項Internet兒童保護法案,即懲罰那些允許兒童訪問的色情網(wǎng)站。但Google拒絕接受傳訊,也拒絕提供政府要求的100萬隨機Web地址以及任何一周內(nèi)所有Google搜索記錄。 Google在法庭文件中稱公開數(shù)據(jù)將侵犯用戶隱私權(quán)并泄露公司的商業(yè)秘密。
Google目前的搜索模式僅僅只是將互聯(lián)網(wǎng)上的各種信息搜集并直接呈現(xiàn)給用戶,在這個過程中,Google并沒有對這些相關(guān)信息進行必要的審核。
然而截至去年年底,我國已有70多萬個網(wǎng)站,約有1.1億網(wǎng)民在網(wǎng)上獲得信息,但網(wǎng)上也出現(xiàn)了一些有害的甚至違法的內(nèi)容,其中有些內(nèi)容危害了青少年的健康成長。中國政府也依法對互聯(lián)網(wǎng)進行管理,盡可能限制那些違法、違背社會道德,尤其是對青少年有害的內(nèi)容在網(wǎng)上傳播。這樣做是合情、合理和合法的。然而,在Google上鍵入某些關(guān)鍵詞卻可以很容易地搜到很多被嚴禁傳播的包含色情內(nèi)容和反動內(nèi)容的網(wǎng)址和頁面。Google以其復(fù)雜而全自動的搜索方法,排除了任何人為因素對搜索結(jié)果的影響,顯然并不符合中國政府的要求。
Google觸及個人隱私
由于Google龐大的信息量吸引了廣大的用戶群,由此也聚集了龐大的用戶相關(guān)信息。Google的隱私資料收集行為也越來越受到人們的關(guān)注和擔(dān)憂。Google-Watch曾于2005年刊登文章,警告用戶小心Google對隱私資料獲取的“陰險”與“強硬”,并列舉了Google在用戶隱私資料收集方面的九大“陰謀疑點”:
1. Google的“老不死”cookie
Google是第一個使用Cookie的搜索引擎供應(yīng)商,其Cookie有效時間竟然直至2038年。Google的Cookie在用戶的硬盤上留下獨一的ID記錄。
2. Google記錄所有能記錄的資料
Google將記錄所有搜索引擎用戶的Cookie ID、網(wǎng)址IP、登錄時間與日期、搜索偏好以及瀏覽器類型。Google還會針對你的IP地址提供給你不同的地域性搜索結(jié)果。
3. Google資料保護并不完善
Google沒有任何資料保存政策,很顯然,他們可以自由讀取搜集到的用戶個人資料。
4. Google不會透露資料的用途
當(dāng)紐約時報2002年在采訪中就資料用途問題咨詢Sergey Brin時,他拒絕對此發(fā)表評論?!?br>
5. Google雇傭“危險人物”
Mutt Cutts——Google重要軟件工程師,曾經(jīng)為美國國家安全局工作。
6. Google工具條是間諜軟件
Google的免費工具條能夠記錄用戶瀏覽的所有頁面,并且讀取用戶的所有Cookie,Google已經(jīng)在其隱私政策中承認這一點。而且Google工具條每次更新都無聲無息,并不詢問用戶是否需要更新。
7. Google的頁面緩存拷貝行為違法
根據(jù)美國網(wǎng)絡(luò)版權(quán)法,Google的頁面緩存記錄行為違法?!?br>
8. Google并不是你的朋友
目前Google占有75%站外鏈接份額,網(wǎng)站管理員不得不尋求Google的認可。如果網(wǎng)站管理員試圖利用Google已知的搜索排名算法提高自己的排名,將受到Google的懲罰,其鏈接和流量將被Google中止。而 Google目前并沒有出臺公開處罰標準和政策。
9. Google是個人隱私的定時炸彈
每天有2億用戶使用Google搜索服務(wù),其中大部分在美國本土以外,Google的隱私資料收集行為將成為個人數(shù)據(jù)的定時炸彈。連華盛頓新成立的安全局資料采集部門都夢想獲得Google搜集資料的高效能力。
事實上,Google也正在試圖誘惑每一個人在互聯(lián)網(wǎng)上完整記錄自己的人生,包括交際、商業(yè)、生活、情感和思想。Google“搜人”并“記錄人的生活”,把物理社會的個體、組織和交往行為映射到互聯(lián)網(wǎng)上,通過數(shù)字化和虛擬化后據(jù)為己有,并最終改造成Google的資產(chǎn)。
Google這個“龐然大物”讓人期待又讓人猜忌——Google是不是知道得太多了?甚至包括我看什么書;我在哪兒旅游;在哪兒沖浪;和誰通訊……。每個人都在猜疑,Google究竟會干什么?由于大量的個人信息集中在一起, Google正在成為互聯(lián)網(wǎng)上最大的個人隱私隱患。盡管有調(diào)查顯示,Google的信任度得分總是很高,然而,一些保護隱私的積極擁護者卻對其頗為擔(dān)心。 Google會不會成為立法者濫施權(quán)力的對象?同樣,犯罪分子會不會對Google下手?犯罪分子可以使用黑客手段,或者在一些公司員工的幫助下,盜取數(shù)據(jù)用于敲詐,或是偷盜他人的ID。
Google面臨糾紛困擾
就像Google產(chǎn)品的安全問題層出不窮一樣,Google所牽涉到的各種糾紛也從未間斷過。
僅2005年Google牽涉到的版權(quán)糾紛就讓其應(yīng)接不暇。法新社和美國娛樂網(wǎng)站 Perfect10曾于2005年先后起訴Google“非法”顯示其網(wǎng)站的文字和圖片內(nèi)容。目前,法新社起訴Google在新聞中使用了其版權(quán)文字和圖片一案尚無定論。如果法新社和Perfect10勝訴,意味著Google不能在查詢結(jié)果中顯示其他網(wǎng)站的文字圖片,這無異于宣布Google的死亡。
Google在2004年12月份宣布了它的圖書館計劃,但隨后有著8000位著作者成員的一個組織將Google告上了法庭,稱該公司“嚴重侵權(quán)”,因為這家搜索引擎巨頭在沒有得到許可的情況下把他們的享有版保護的書籍用于商業(yè)用途。 2006年新年伊始,Google Talk就被起訴,擁有目前大部分網(wǎng)絡(luò)電話都使用到的技術(shù)的Rates Technology公司正對Google的基于網(wǎng)頁的電話呼叫系統(tǒng)提出控告,并要求索賠50億美元。
除了版權(quán)方面的糾紛,Google還面臨著廣告欺詐的起訴。2005年6月,網(wǎng)絡(luò)營銷工具銷售商Click Defense正式向美國加利福尼亞州圣何塞地方法院提起訴訟,指控Google沒能有效地保護廣告客戶免受“點擊欺騙”,從而使客戶損失了至少500萬美元。盡管Google表示其公司已經(jīng)采取相應(yīng)措施,防止點擊欺騙的發(fā)生。但Click Defense認為,Google采取的措施還遠遠不夠,無法有效的保護廣告客戶免受點擊欺騙。
而春節(jié)期間悄然上線的“google.cn”中國網(wǎng)站近日被指涉嫌違規(guī)經(jīng)營。 Google.cn事實上并沒有取得在中國運營互聯(lián)網(wǎng)信息服務(wù)所必須的ICP牌照,而按照我國現(xiàn)行政策的相關(guān)規(guī)定,外資在沒有得到許可的前提下,并不允許經(jīng)營包括ICP在內(nèi)的電信業(yè)務(wù)。目前Google.cn和“趕集網(wǎng)”采用了同一張ICP證,即趕集網(wǎng)所持有的編號為“京ICP證050124號”的ICP 證。Google.cn的做法明顯不符合我國現(xiàn)行的關(guān)于外資網(wǎng)站申辦ICP經(jīng)營許可證的相關(guān)管理政策。目前此事已經(jīng)引起信產(chǎn)部的關(guān)注,有關(guān)部門正在對這一問題進行調(diào)查。Google全球副總裁兼中國區(qū)總裁李開復(fù)就此專門出面解釋,但只是表示“一直受到政府部門的指導(dǎo)”,卻沒能明確申明Google中國網(wǎng)站屬于“合法”還是“違法”。信產(chǎn)部方面則表示“早就注意到這個問題”,并已上報有關(guān)領(lǐng)導(dǎo),等待最后“說法”。
Google遭遇中國本土
搜索引擎公司的挑戰(zhàn)
根據(jù)市場調(diào)查公司艾瑞的統(tǒng)計數(shù)據(jù),2004年,Yahoo、3721、一搜三家在搜索市場上的總市場份額為30.2%,略低于百度的33.1%,而Google只占了22.4%。2005年,百度占的份額仍是最高,達到46.5%。其次是Google的26.9%。不論Google在美國多么成功,但在中國卻正逐漸被本土搜索引擎超越。
首先,Google對于中文關(guān)鍵字的理解顯然沒有中國人自己理解得透徹。Google在英文搜索市場可能比較得心應(yīng)手,但是在進行中文搜索時,結(jié)果往往把單詞拆得太碎,以至于搜出來的東西都不是想搜的東西。
其次,在中國Google面臨著渠道的最大挑戰(zhàn)。Google在美國是采取直銷的模式,即廣告主可以通過登陸Google的官方網(wǎng)站Google AdWords頁面注冊辦理(需國際信用卡)。這個過程簡單且十分方便,沒有任何中間環(huán)節(jié)。但是,在中國卻情況迥異。在中國,國內(nèi)的搜索廣告都是走渠道代理商。本土搜索引擎從幾年前就開始建渠道,但是Google目前在國內(nèi)的代理商只有三四家。
再者,不僅是渠道,付費方式也是Google必須面對的一個問題。在中國信用卡并不普及,而且企業(yè)也不能通過信用卡付廣告費。另外還有很多細節(jié),例如中國的廣告主并沒有習(xí)慣自己上網(wǎng)去登搜索廣告。這是需要引導(dǎo)的,需要有一定的人力、物力、財力等方面的投入。
Google中文市場前景不被看好
Google進入中國市場,更面臨著技術(shù)和成本等方面的問題。
首先,從技術(shù)角度來講,中文搜索離不開中文分詞。目前在中文搜索引擎領(lǐng)域,國內(nèi)的搜索引擎已經(jīng)和國外的搜索引擎效果上相差不遠。之所以能形成這樣的局面,有一個重要的原因就在于中文和英文兩種語言自身的書寫方式不同,這其中對于計算機涉及的技術(shù)就是中文分詞。對于Google這樣一個建立在英文搜索技術(shù)上的搜索引擎而言,其在中文分詞技術(shù)上卻不及國內(nèi)的搜索引擎。
比如,《功夫》公映之前很久,在百度上檢索“功夫”就能直接指向周星馳的電影,可是 Google搜索相同的“功夫”,則大失所望。因為這些時令性的關(guān)鍵詞都需要專業(yè)團隊去隨時添加,由于Google缺乏專門針對中國市場的開發(fā)力量,尤其是對中國互聯(lián)網(wǎng)信息檢索存在的問題了解不透,所以,Google對于國內(nèi)市場需求的反應(yīng)速度很慢,本地化技術(shù)服務(wù)力量也跟不上,無法解決國內(nèi)網(wǎng)民遇到的一些實際問題。
根據(jù)
清華大學(xué)IT 可用性實驗室2005中文搜索引擎質(zhì)量對比的研究表明:本土搜索引擎在以網(wǎng)頁搜索為代表的搜索引擎質(zhì)量方面有較大突破。百度在總體指標上已超過 Google成為第一。本土搜索引擎的技術(shù)優(yōu)勢突出表現(xiàn)在相關(guān)性、網(wǎng)頁覆蓋率、反作弊、中文分詞等方面。在中文分詞技術(shù)上,本土搜索引擎有明顯優(yōu)勢。從服務(wù)功能對比看,海外搜索引擎對國內(nèi)搜索需求變化不如本土搜索引擎敏感,服務(wù)功能不如本土搜索引擎豐富(如圖3)。
其次,從轉(zhuǎn)化成本角度來講,Google的服務(wù)是全球化的,各種語言的網(wǎng)頁按一種固定或不固定的比例存放在美國服務(wù)器上。假設(shè)Google要檢索4億中文網(wǎng)頁,而中文網(wǎng)頁在其中占5%,那么Google總共就要檢索80億網(wǎng)頁;百度基本只為中國網(wǎng)民服務(wù),所以它只需要為這4億中文網(wǎng)頁提供假設(shè)1000臺服務(wù)器,但為了實現(xiàn)同樣的效果,Google則需要2萬臺服務(wù)器。
另外,在相對區(qū)間的對比上,國內(nèi)純中文搜索引擎的網(wǎng)絡(luò)推廣應(yīng)用遠高于國外搜索引擎中文版。由于國外搜索引擎本地化程度不高,準確性差、查全率低、內(nèi)容更新不及時、響應(yīng)速度慢、不適合中文使用習(xí)慣、信息相關(guān)性不如英文搜索引擎,諸多難題嚴重制約了外國搜索引擎中文版的本地化推廣。在國內(nèi)搜索引擎市場上,中文搜索引擎占有絕對優(yōu)勢,搜索引擎的未來更將是本地化服務(wù)一統(tǒng)天下,而Google恰恰是在這方面做的很不好。嚴格地說,Google還沒有真正實現(xiàn)本土化,Google中文的模式甚至沒有任何技術(shù)優(yōu)勢。
綜上所述,盡管Google在英語語系的國家更有市場,但在中國,卻是本土搜索引擎占了上風(fēng)。(作者系中國出版科學(xué)研究所研究員人民郵電出版社副社長)