本文內(nèi)容節(jié)選自圖書《數(shù)據(jù)的本質(zhì)》,作者 車品覺,阿里巴巴集團(tuán)前副總裁、首任阿里巴巴數(shù)據(jù)委員會會長
一次,曾鳴特地找到我,對我說:“品覺,作為阿里 BI(商業(yè)智能)部門的老大,你的任務(wù)就是努力將 BI 部門消滅掉。”我當(dāng)時真的蒙了。作為 BI 部門的老大,你要我努力將 BI 部門消滅掉?
后來我才明白,這正是他的戰(zhàn)略思考,終局的想法是我們要將數(shù)據(jù)做得越來越便捷,未來根本不應(yīng)該有集中式的 BI 部門。
數(shù)據(jù)應(yīng)該回歸本身,讓所有人都可以分析,人人都可以成為數(shù)據(jù)分析師。不是說沒有 BI 部門,而是說未來某天數(shù)據(jù)分析技能已經(jīng)被每個業(yè)務(wù)人員掌握。即便從一個數(shù)據(jù)分析師的角度看,曾鳴的決定也頗具遠(yuǎn)見和創(chuàng)造性。
《決戰(zhàn)大數(shù)據(jù)》、《數(shù)據(jù)的本質(zhì)》作者:車品覺 阿里巴巴集團(tuán)前副總裁,紅杉資本中國基金專家合伙人
如果我對你說, 2010 年時,阿里的數(shù)據(jù)化運(yùn)營也是摸著石頭過河,最初的數(shù)據(jù)分析產(chǎn)品還不到 50 個用戶,業(yè)務(wù)方對數(shù)據(jù)化管理一點(diǎn)也不感冒,大家可不要感到奇怪。
到了 2015 年,阿里的數(shù)據(jù)平臺用戶已經(jīng)超過 8 000 人。在整個進(jìn)程中,我們從建立一支精銳的數(shù)據(jù)分析團(tuán)隊(duì),發(fā)展到能開發(fā)一個全公司的業(yè)務(wù)和工程人員都能使用的數(shù)據(jù)平臺。數(shù)據(jù)戰(zhàn)略從數(shù)據(jù)化運(yùn)營,轉(zhuǎn)移到了運(yùn)營數(shù)據(jù),并協(xié)調(diào)不同事業(yè)群數(shù)據(jù)共享、共創(chuàng)及標(biāo)準(zhǔn)化,同時又要保持業(yè)務(wù)的獨(dú)立及積極性。
6 年中讓我記憶最深刻的事情,是聚劃算一個部門的自動化項(xiàng)目。馬云要求我們用人工智能和大數(shù)據(jù)去取代一個近百人的部門,而且業(yè)務(wù)增長率不能下降,難度可想而知。經(jīng)過這個項(xiàng)目的錘煉,我一直在思考,數(shù)字經(jīng)濟(jì)引擎的形態(tài)是什么樣的,以及如何搭建新科技下的數(shù)字經(jīng)濟(jì)引擎,也深深感受到,未來每家公司都將是“大數(shù)據(jù) + 人工智能”公司,這在未來將不再是一個夢想。
我們應(yīng)該清楚地認(rèn)識到, 商業(yè)基礎(chǔ)正因眾多終端帶來的全域大數(shù)據(jù)而發(fā)生著改變。 它帶來的變革不限于數(shù)據(jù)本身,還有思考社會和商業(yè)模式將如何被改變的全新角度。在全域大數(shù)據(jù)的大潮之下,每家公司都要重新思考,當(dāng)互聯(lián)網(wǎng)的場景從單一的桌面轉(zhuǎn)移到多源、多終端時,不僅會帶來豐富的空間維度,還會增加更多從前匪夷所思的新場景所產(chǎn)生的數(shù)據(jù)。
這么多零散的數(shù)據(jù)和維度疊加在一起,下一難題就變成了如何保證有效地存儲、更新、辨識和連接這些數(shù)據(jù),并靈活地使用它們。在我看來,開啟“上帝視角”是未來趨勢,這無疑是激動人心的。
在數(shù)據(jù)科學(xué)成為炙手可熱的話題的兩年后,我發(fā)現(xiàn)我被企業(yè)管理層問得最多的問題是:如何確保有足夠多的數(shù)據(jù)來發(fā)展人工智能?需要儲備什么樣的人才? 我認(rèn)為,大家都忽略了大數(shù)據(jù)能力的根源來自連接,而連接的基礎(chǔ)是數(shù)據(jù)的流通和標(biāo)準(zhǔn)化。
以阿里為例,數(shù)據(jù)打通絕對不是馬云一聲令下就可以解決的問題。從 2014 年開始,阿里管理層數(shù)次要求各業(yè)務(wù)部門(包括支付寶)無條件地將數(shù)據(jù)互通,然而換來的終究也只是表面的打通而已。手下人的陽奉陰違也是花招不少。比如,我有數(shù)據(jù),但是我不告訴你有什么;就算你知道我有數(shù)據(jù),但我不能保證提供給你的是有質(zhì)量的數(shù)據(jù)。因?yàn)闆]有業(yè)務(wù)關(guān)聯(lián),對方很難長期、義務(wù)地配合你,所以就更不會把新增的業(yè)務(wù)數(shù)據(jù)和盤托出了。我認(rèn)為,問題的關(guān)鍵,在于互惠互利。只有你找到真正的痛點(diǎn),才能將企業(yè)數(shù)據(jù)循環(huán)打通。
在這個人工智能蓬勃發(fā)展的時代,數(shù)據(jù)的增量比存量多。多變的業(yè)務(wù)場景也意味著需要敏捷的數(shù)據(jù)更新(包括結(jié)構(gòu))。在你使用數(shù)據(jù)時,數(shù)據(jù)本身可能早就出現(xiàn)了定義上的變化, Data broken(數(shù)據(jù)斷裂)指的就是數(shù)據(jù)已經(jīng)不能反映當(dāng)前現(xiàn)實(shí)。因此,以這些斷裂數(shù)據(jù)為基礎(chǔ)的任何人工智能算法,都會相應(yīng)地產(chǎn)生偏差。
這種事情表明了什么?所有的數(shù)據(jù)流通必須建立在一個永恒不變的道理上:互惠互利,否則你無法做到對數(shù)據(jù)進(jìn)行適時的修正。 雖然說高層掌握著權(quán)力,但要發(fā)揮出整體的數(shù)據(jù)戰(zhàn)略,只靠從上而下的命令是不可能的,還必須依靠從下而上的共建共創(chuàng)。只有這樣,才能實(shí)現(xiàn)合力而成的多源異構(gòu)大數(shù)據(jù)。所以我一直強(qiáng)調(diào): 大數(shù)據(jù)是自利、利他的成品。
在阿里時,我是怎么處理部門間數(shù)據(jù)互通這件事情的呢?很簡單,首先是找出大家有意愿共用的部分,我稱其為企業(yè)內(nèi)的公共數(shù)據(jù),然后安排資源把這一部分先建設(shè)起來。選擇公共數(shù)據(jù)也有一定的技巧,簡單歸類就是:各部門已經(jīng)在高頻率但低效率的單線流通的數(shù)據(jù),被野蠻重復(fù)復(fù)制到各部門的相同數(shù)據(jù),大家都有意愿首先標(biāo)準(zhǔn)化的數(shù)據(jù)。當(dāng)這些帶有公共性質(zhì)的核心數(shù)據(jù)建立起來之后,大家就能更容易地感受到數(shù)據(jù)高質(zhì)量流通的意義及好處。要保證這些數(shù)據(jù)的質(zhì)量和新鮮度也相對變得容易了。
之后,我采取的是共創(chuàng)共贏策略。我將我們部門所有的、我認(rèn)為很有可能成為公共數(shù)據(jù)的數(shù)據(jù),全部都放在大家眼前。如果其他部門有人要使用的話,這些數(shù)據(jù)可謂招之即來。當(dāng)然,前提是這些資源都是我先開發(fā)完的。當(dāng)他們所有人都開始使用這些數(shù)據(jù)時,我就可以輸出技術(shù)及標(biāo)準(zhǔn),去幫助其他部門完成更大范圍的數(shù)據(jù)打通。
加入支付寶后,我面對的第一件事就是著手組建支付寶數(shù)據(jù)分析師團(tuán)隊(duì)。 2010 年的支付寶,大部分業(yè)務(wù)團(tuán)隊(duì)對數(shù)據(jù)團(tuán)隊(duì)都不太滿意,而且高層對數(shù)據(jù)能產(chǎn)生的價值也沒有太多認(rèn)識。同時,由于當(dāng)時數(shù)據(jù)負(fù)責(zé)人調(diào)職,導(dǎo)致支付寶的數(shù)據(jù)分析和數(shù)據(jù)技術(shù)部門被分開管理。
面對數(shù)據(jù)分析和技術(shù)團(tuán)隊(duì)的目標(biāo)不一致,業(yè)務(wù)部門對為什么要使用數(shù)據(jù)以及如何善用數(shù)據(jù)充滿疑問,甚至有人認(rèn)為數(shù)據(jù)分析僅是門面功夫。但我堅(jiān)持?jǐn)?shù)據(jù)分析產(chǎn)品化路線,相信數(shù)據(jù)分析的工作最終必須落地在產(chǎn)品上。
從解放集中式的數(shù)據(jù)分析師團(tuán)隊(duì)到“人人都是分析師”的泛化過程中,我們的業(yè)務(wù)部門自己就可以便捷地使用工具解決問題。經(jīng)過一年多的努力,有一天 CEO (彭蕾)走到我辦公室對我說:“你知道嗎?你們做的產(chǎn)品讓我覺得很爽,我很喜歡這個產(chǎn)品?!笨吹酵潞屠习鍖Ξa(chǎn)品的支持,讓我肯定自己在支付寶走的這條路是正確的。如果讓我總結(jié)這其中的精髓,我的秘訣是: 數(shù)據(jù)分析也要講究用戶體驗(yàn)。
當(dāng)我 2010 年進(jìn)入阿里時,我們的數(shù)據(jù)團(tuán)隊(duì)會利用數(shù)據(jù)去做好報(bào)告,以支持業(yè)務(wù)部門,讓業(yè)務(wù)部門可以更好地把握其業(yè)務(wù)。數(shù)據(jù)團(tuán)隊(duì)繼而在 2012 年開發(fā)了很多數(shù)據(jù)產(chǎn)品,將重復(fù)的業(yè)務(wù)分析需求產(chǎn)品化,把數(shù)據(jù)能力泛化到一線團(tuán)隊(duì)。
幾年間,大數(shù)據(jù)距離成為業(yè)務(wù)的核心就僅差一步。直到谷歌的無人駕駛汽車項(xiàng)目出現(xiàn),我忽然如夢初醒,這不就是業(yè)務(wù)與數(shù)據(jù)的無縫對接嗎?
問題來了:商業(yè)運(yùn)營的過程能像無人駕駛汽車一樣實(shí)現(xiàn)全面的自動化嗎?
2014 年,我接了一個任務(wù),即把阿里某團(tuán)購業(yè)務(wù)的運(yùn)營從幾十個人的團(tuán)隊(duì)完全轉(zhuǎn)變?yōu)樽詣踊ㄈト嘶?,這項(xiàng)工作需要大量數(shù)據(jù)、多種算法及 IT 系統(tǒng)的有機(jī)結(jié)合。在這個過程中,我們要把已知工作流程中的人為決策,轉(zhuǎn)化為數(shù)據(jù)驅(qū)動的自動化決策(我們稱其為數(shù)字經(jīng)濟(jì)引擎)。而決策之間的權(quán)衡也是一種算法,決策本身就是一場博弈,越大的場景運(yùn)營起來毫無疑問就越復(fù)雜。后來這個項(xiàng)目按計(jì)劃完成了,但實(shí)際上棘手的問題并未真正解決。
在這個過程中,我們更體驗(yàn)到智能 / 自動化所要求的數(shù)據(jù)質(zhì)量更高,數(shù)據(jù)不足的情況更明顯,尤其是外部數(shù)據(jù)(包括競爭環(huán)境)的稀缺更非靠我們一己之力能在短期內(nèi)解決的。
另外,數(shù)據(jù)商業(yè)引擎的最佳原則是,人為干預(yù)越少,數(shù)據(jù)回流越順暢。最終,這個項(xiàng)目其實(shí)是在妥協(xié)中結(jié)束的。
最近受阿里前同事的盛情邀請,讓我有機(jī)會回杭州看一個智能客服的項(xiàng)目,即用客服機(jī)器人取代人工客服。剛一落座,我就問道:“機(jī)器人還有多長時間可以完全取代人類?”我很期待作為人工智能應(yīng)用一線負(fù)責(zé)人的答案,他明確地表示“5 年”。
他提到,讓客服機(jī)器人獨(dú)立運(yùn)作前,首先要做的是惡補(bǔ)客服機(jī)器人在沒有足夠數(shù)據(jù)的情況下的一些智識盲點(diǎn)。短期的改善方法是,他們設(shè)置了一個叫“人工智能培訓(xùn)師”的新崗位,幫助解決客服機(jī)器人數(shù)據(jù)不足的問題。借用人工智能“大牛”、香港科技大學(xué)楊強(qiáng)教授的觀點(diǎn),客服機(jī)器人的好壞,關(guān)鍵在于有沒有高質(zhì)量的數(shù)據(jù)。令人興奮的是,目前客服機(jī)器人(非語音)已經(jīng)能自動應(yīng)對 85% 的客戶訪問了。
最后,我想分享,阿里在數(shù)據(jù)化實(shí)踐過程中有三大原則:
相信數(shù)據(jù)是未來所有業(yè)務(wù)的核心競爭力。
不在線的數(shù)據(jù),不是大數(shù)據(jù)。
數(shù)據(jù)的有效使用與高度流通要有互惠互利機(jī)制。
只有真正做到這三點(diǎn),才能讓大數(shù)據(jù)真正成為企業(yè)增長的殺手锏。
《數(shù)據(jù)的本質(zhì)》 湛廬文化策劃出版