共2頁(yè)
1 2中國(guó)人有句古話(huà)叫做:“學(xué)以至用”。若干年我一直對(duì)這句話(huà)封為神靈,因?yàn)橹挥弥掠貌拍芸吹綄W(xué)的效果,了解到學(xué)的不足,享受到學(xué)的快樂(lè)。
搜索引擎在過(guò)去兩年的發(fā)展并沒(méi)有大突破,但是卻逐步走向成熟,走向商業(yè)。正是這兩年的時(shí)間,部分的業(yè)余時(shí)間都用來(lái)做一些開(kāi)發(fā)和研究,當(dāng)我逐漸了解的更多的時(shí)候,也是我結(jié)束單槍披馬的時(shí)候。未來(lái)的興趣也許會(huì)轉(zhuǎn)向分類(lèi)技術(shù),因此希望能夠用這個(gè)系列為這段成長(zhǎng)歲月化上句號(hào)。
所謂暗規(guī)則,其實(shí)就是一些生活中非常顯然的規(guī)則,只不過(guò)在搜索引擎這個(gè)領(lǐng)域表現(xiàn)的不是那么的突出,之所以不夠突出,原因最主要的是因?yàn)樗阉饕孢€在發(fā)展,市場(chǎng)還在進(jìn)一步加劇競(jìng)爭(zhēng),這些暗規(guī)則或多或少已經(jīng)在反映在現(xiàn)在的搜索引擎上了。相信有一天,這些規(guī)則會(huì)被看到的更清晰,更深入。
搜索引擎暗規(guī)則之一
《新約•馬太福音》中有這樣一個(gè)故事,一個(gè)國(guó)王遠(yuǎn)行前,交給三個(gè)仆人每人一錠銀子,吩咐他們:"你們?nèi)プ錾?,等我回?lái)時(shí),再來(lái)見(jiàn)我。"國(guó)王回來(lái)時(shí),第一個(gè)仆人說(shuō):"主人,你交給我們的一錠銀子,我已賺了10錠。"于是國(guó)王獎(jiǎng)勵(lì)他10座城邑。第二個(gè)仆人報(bào)告說(shuō):"主人,你給我的一錠銀子,我已賺了5錠。 "于是國(guó)王例獎(jiǎng)勵(lì)了他5座城邑。第三個(gè)仆人報(bào)告說(shuō):"主人,你給我的一錠銀子,我一直包在手巾里存著,我怕丟失,一直沒(méi)有拿出來(lái)。"于是國(guó)王命令將第三個(gè)仆人的一錠銀子也賞給第一個(gè)仆人,并且說(shuō):"凡是少的,就連他所有的也要奪過(guò)來(lái)。凡是多的,還要給他,叫他多多益善。"
這就是馬太效應(yīng)。
簡(jiǎn)單的說(shuō),就是讓富有者更加富有,讓貧窮者更加貧窮。
對(duì)于搜索引擎來(lái)說(shuō),馬太效應(yīng)是一條暗規(guī)則。10年的發(fā)展期過(guò)后,google,yahoo等已經(jīng)成為市場(chǎng)的絕對(duì)主流,利潤(rùn)的分享趨向與這些超大型的搜索引擎,而不是中小型的搜索引擎。
例如,你可以制作一個(gè)搜索引擎,流量是google的1/1000(這個(gè)數(shù)目并不大,每天的獨(dú)立IP是大約6萬(wàn),PageView是30萬(wàn)),但是你拿到的回報(bào)和這個(gè)搜索引擎的價(jià)值絕對(duì)沒(méi)有g(shù)oogle的1/1000(這個(gè)大約是6000萬(wàn)美金,或者5億人民幣)。
馬太效應(yīng)還能反應(yīng)在市場(chǎng)傾向于分化,傾向于使得市場(chǎng)的份額集中在一兩個(gè)巨頭的身上。因?yàn)槭袌?chǎng)對(duì)領(lǐng)頭羊的投入會(huì)拿到比例更高的回報(bào),因此廣告/合作等的機(jī)會(huì)也會(huì)遵從馬太效應(yīng),成為領(lǐng)頭羊的東風(fēng)。
馬太效應(yīng)還表現(xiàn)在當(dāng)搜索引擎成為領(lǐng)頭羊的時(shí)候,能夠聚合更多的資金人力擴(kuò)展這個(gè)優(yōu)勢(shì),例如啟動(dòng)一系列的其它的業(yè)務(wù)Mp3,Pic search,Vedio等,鞏固和擴(kuò)大優(yōu)勢(shì)。
那么對(duì)于中小型的搜索引擎而言,價(jià)值在哪里呢?
市場(chǎng)是殘酷的,可以預(yù)言現(xiàn)在大多數(shù)的中小型搜索引擎從經(jīng)濟(jì)的角度講都要滅亡,能夠保留下來(lái)的一定不會(huì)是單純的搜索引擎,也許是被某一個(gè)網(wǎng)站收購(gòu)成為其附加值,也許轉(zhuǎn)向做企業(yè)內(nèi)部搜索等現(xiàn)在市場(chǎng)還沒(méi)有顯著分化的領(lǐng)域。
我以前曾經(jīng)寫(xiě)過(guò)20/80 法則 重新闡釋?zhuān)@里從新提一下:
20/80法則也叫二八定律,即巴萊多定律。巴萊多定律是19世紀(jì)末20世紀(jì)初意大利經(jīng)濟(jì)學(xué)家巴萊多發(fā)明的。他認(rèn)為,在任何一組東西中,最重要的只占其中一小部分,約20%,其余80%盡管是多數(shù),卻是次要的,因此又稱(chēng)二八定律。
在搜索引擎的設(shè)計(jì)上,可以說(shuō)大多數(shù)的搜索引擎在搜索結(jié)果上第一頁(yè)有80%的結(jié)果是相同的,不同的只有20%??墒钦沁@20% make different.
這20%的差別也是不同搜索引擎之間的差距,能夠完善這20%將對(duì)一個(gè)搜索引擎來(lái)說(shuō)是至關(guān)重要的。
在另外一方面,對(duì)于一個(gè)搜索引擎的完善,例如你可以花20%的努力做到80%的效果,而要想提高剩下的20%的效果也許要耗費(fèi)80%的精力。
一個(gè)簡(jiǎn)單的例子,一個(gè)搜索引擎現(xiàn)在還比較初級(jí),也許分詞和搜索相關(guān)的準(zhǔn)確率在80%左右,想要進(jìn)一步提高,也許要調(diào)整40,50個(gè)參數(shù),調(diào)整很多方面的因子,考慮很多的算法,花了極大的精力后發(fā)現(xiàn)只提高了一點(diǎn),再調(diào)整,如此三番,也許很久一段時(shí)間后發(fā)現(xiàn)有90%了,這個(gè)10%就是大的突破,但是要花去的努力要比從0%到80%大的多的多。
搜索引擎各項(xiàng)參數(shù)的差距也許只有幾個(gè)百分點(diǎn),可是這幾個(gè)百分點(diǎn)就是真正的差別,就真得創(chuàng)造了勝者和失敗者。
從搜索的方面看,20 80 法則有另外的意義,80%的搜索集中在20%的少量關(guān)鍵詞上,也就是說(shuō)有20%的搜索詞匯占了80%的總體搜索流量。搜索的詞頻可以通過(guò)搜索引擎的每天的統(tǒng)計(jì)得到,在某一些特殊的情況,這些分布可以用來(lái)對(duì)搜索引擎進(jìn)行非常好的矯正工作。
車(chē)東在Google的“破窗”里提到Spam會(huì)傳播更多的Spam,這個(gè)就是搜索引擎破窗效應(yīng)的體現(xiàn)。
首先解釋一下什么是破窗理論:
"破窗理論"體現(xiàn)的是細(xì)節(jié)對(duì)人的暗示效果,以及細(xì)節(jié)對(duì)整體影響的擴(kuò)展性
美國(guó)心理學(xué)家詹巴斗曾經(jīng)做過(guò)一個(gè)"偷車(chē)實(shí)驗(yàn) ",將兩輛一模一樣的轎車(chē)分別放在一個(gè)環(huán)境很好的中產(chǎn)階級(jí)社區(qū)和環(huán)境比較臟亂的貧民區(qū),結(jié)果發(fā)現(xiàn)貧民區(qū)的車(chē)很快被偷走了,而另一輛幾天后仍然完好無(wú)損;如果將中產(chǎn)階級(jí)社區(qū)的那輛車(chē)的天窗玻璃打破,幾個(gè)小時(shí)后,那輛車(chē)也被偷了。
后來(lái),在此實(shí)驗(yàn)基礎(chǔ)上,美國(guó)政治學(xué)家威爾遜和犯罪學(xué)家凱林提出了有名的"破窗理論":如果有人打壞了一棟建筑上的一塊玻璃,又沒(méi)有及時(shí)修好,別人就可能受到某些暗示性的縱容,去打碎更多的玻璃。
對(duì)于搜索引擎來(lái)說(shuō),前面chedong的例子已經(jīng)非常明顯,隨著更多的人認(rèn)識(shí)到搜索引擎可以獲取更多的利益,不法之徒當(dāng)然回去嘗試采用各種作弊手段進(jìn)行擾亂正常的拍名和搜索結(jié)果,如果搜索引擎不即時(shí)制止, 這種情況就會(huì)泛濫,最好到嚴(yán)重的要影響到用戶(hù)使用的地步的時(shí)候再來(lái)處理也就要麻煩的多和面臨更多的作弊者。
看這個(gè)搜索結(jié)果Google 里搜索 天下無(wú)賊免費(fèi)電影下載,你完全可以想像這樣的結(jié)果是對(duì)Spam的一種變相的鼓勵(lì)。
破窗理論的推論就是注重細(xì)節(jié),防微杜漸。一旦有第一個(gè)spam出現(xiàn),即時(shí)的制止,那么后面的spam也許就不會(huì)那么輕易的去搜索引擎上嘗試,因?yàn)楫吘垢矣谧龅谝唬ǖ谝粋€(gè)打破窗戶(hù))的人還是少數(shù)。
看看Baidu和Yahoo,在破窗上封堵的就比google快一些,因此基本上現(xiàn)在能夠看到的spam基本上都來(lái)自google的結(jié)果。
google adsense呢?我以前曾經(jīng)寫(xiě)過(guò)幾篇關(guān)于fraud click(點(diǎn)擊欺騙)的文章,fraud click的破窗隨著google去年把修斯頓的一家公司推上了法庭而彌補(bǔ)好了??墒橇硗庖环N更嚴(yán)峻的破窗又出現(xiàn)了,直接危機(jī)到google adsense的存亡:廣告內(nèi)容作弊。
來(lái)源: FullSearcher.com | 作者: | 發(fā)表時(shí)間: 2006-8-28 17:47:00