造就第288位講者 逄偉
攜程首席數(shù)據(jù)官
去年,有一條特別著名的“狗”,叫Alpha Go,它幾乎打敗了所有的人類圍棋選手,也把“人工智能”這個詞變成了我們身邊的一個熱詞。
其實,比起在圍棋比賽里戰(zhàn)勝人類選手,人工智能和數(shù)據(jù)正在改變著我們社會的方方面面,推動著很多行業(yè)的發(fā)展,旅游行業(yè)也不例外。
今天我跟大家分享的主題是——旅行足跡背后的數(shù)據(jù)智能。
人類喜歡旅行,旅行可以帶我們?nèi)ズ芏嗟胤?,海邊、高山、繁華都市、寧靜鄉(xiāng)村……在旅行中我們會遇見很多人,發(fā)生很多故事,互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的發(fā)展使得很多旅行的功能都可以通過一個APP來實現(xiàn)。
在旅行前,你會通過搜索攻略決定去什么地方玩;在旅行中,你可以去看當(dāng)?shù)赜惺裁赐鏄罚梢酝ㄟ^APP來訂票、訂酒店。
所有的這一切,不僅讓我們旅行的足跡落在了山川大河之中,也都落在了線上。線上的旅行足跡是什么?其實就是數(shù)據(jù)。
我們在旅行當(dāng)中會產(chǎn)生什么樣的數(shù)據(jù)?
第一,結(jié)構(gòu)化數(shù)據(jù)。你在訂票及使用各種服務(wù)時,會產(chǎn)生很多交易數(shù)據(jù)。我們知道你去過哪個城市,住了哪家酒店,是什么價位,這些是結(jié)構(gòu)化數(shù)據(jù)。
第二,半結(jié)構(gòu)化數(shù)據(jù)。我們知道你在使用APP的過程當(dāng)中,在哪一個網(wǎng)頁停留了多長時間,點了哪一個鏈接。你的一舉一動其實都會被系統(tǒng)追蹤,這是你的行為數(shù)據(jù),它們是半結(jié)構(gòu)化的。
第三,非結(jié)構(gòu)化數(shù)據(jù)。很多酒店會上傳圖片,你在旅行的過程當(dāng)中也會寫些點評,甚至寫些游記,其中有大量的圖片、文本、視頻、語音數(shù)據(jù),這些是非結(jié)構(gòu)化的數(shù)據(jù)。
旅行數(shù)據(jù)能告訴我們什么?
現(xiàn)在信息流非常流行,可能很多人都會等著各種信息的推送,但在旅行過程中,大部分人都還在使用搜索,超過半數(shù)的人會自己去搜索想要的信息,尋找自己想去玩的地方,搜索還是旅行的一個重要手段。
訂酒店大家關(guān)心什么?大部分人關(guān)心位置,37%左右的人關(guān)心星級,還有11%左右的人關(guān)心價格。所以,位置、星級、價格是我們在選酒店時會重點考慮的因素。
我們再看一下點評,大家去淘寶購物會看點評,去住酒店也會看點評,點評仍然是選擇酒店一個非常非常重要的因素。如果你的點評分在4以下,幾乎就沒有人會選擇你的酒店了。
大家可能想不到,一般人選擇酒店,如果去三亞,他會比較80家;如果去成都,他會比較22家;如果去重慶,他會比較25家。所以,在一個旅游城市,酒店競爭非常非常激烈。
在以前,旅行是一件非常謹(jǐn)慎的事情,很多人可能會提前幾個月做研究,比較不同的酒店及航班,找到最合適自己的行程??墒乾F(xiàn)在,旅行已經(jīng)變得越來越隨意、隨性。超過半數(shù)的人在預(yù)定一個旅程時,幾乎都是當(dāng)天預(yù)定,當(dāng)天入住。
我們再看一下男和女的區(qū)別。大部分男性訂酒店時,他會關(guān)心早餐好不好吃,而女性不會,她更多看景觀及室內(nèi)布局。
以上這些統(tǒng)計數(shù)據(jù)告訴了我們很多有趣的信息,搜索和廣告可能是互聯(lián)網(wǎng)上最早大規(guī)模應(yīng)用數(shù)據(jù)的一個階段,近兩年隨著人工智能深度學(xué)習(xí)的發(fā)展,機器學(xué)習(xí)擁有了新的能力。
這些能力主要體現(xiàn)在三個方面:
第一,對圖像的識別及理解;
第二,對自然語言的識別及對文本的處理;
第三,對語音和視頻的理解。
有了這些能力,我們對數(shù)據(jù)的應(yīng)用會變得跟以前很不一樣。
給你一個旅游行業(yè)的大腦
旅行是一個非常好玩的行業(yè),電商可能會給你推薦產(chǎn)品,告訴你買買買,但旅行非常復(fù)雜,它涉及到交通、景點、玩樂、吃住,涉及到我們生活中的方方面面,是全場景的旅行,這就意味著我們會有全場景的數(shù)據(jù)。
我們可以知道,今天有多少人從北京飛到上海;我們也可以知道,今天有多少人入住舊金山的一家酒店;甚至再結(jié)合一些外部數(shù)據(jù),我們還知道今天在上海梅賽德斯奔馳中心,我們現(xiàn)在有一個“造就”的講座,這些都是宏觀的數(shù)據(jù)。
微觀的數(shù)據(jù)有什么?
我們可以知道每一個人的愛好。比如,有的人喜歡海灘,有的人喜歡都市,有的人喜歡豪華酒店,有的人喜歡探險等等。
我們也可以知道每個商戶的特點。比如,有的酒店的服務(wù)好,有的酒店的服務(wù)差。
把所有這些數(shù)據(jù)結(jié)合起來,加上人工智能的算法,我們其實就形成了一個旅游行業(yè)的大腦。這個大腦可以做到非常多的事情。在行業(yè)上,它可以賦能商家去做更好的服務(wù);對于個人,它可以幫助我們的旅行決策變得更簡單。
我們來看一個具體的例子。旅行產(chǎn)品跟電商產(chǎn)品有很大的區(qū)別,今晚上海希爾頓酒店的一個房間可能價值1000元,但過了12點,這間房的價值就是零,因為這個時間已經(jīng)過去了,沒人入住。
大家想一下,我們現(xiàn)在從上海飛往舊金山的一張機票大概是多少錢?3000到10000元不等,那如果這架飛機上的某個座位這一天沒有賣掉,那它的價值是多少?是零。
所以在旅游行業(yè),商家的收益管理非常重要。一般的小酒店雇不起專業(yè)收益管理人員,店主只能靠自己的經(jīng)驗來判斷是旺季還是淡季,是要提價還是降價。那稍微高端一點的品牌酒店,比如說像萬豪、希爾頓,會雇一個經(jīng)濟學(xué)碩士或者博士專門做收益管理,根據(jù)供需關(guān)系去動態(tài)地調(diào)整價格。
但是大部分公司其實做得并不好。為什么?因為他們沒有數(shù)據(jù)。他們最多只有酒店歷史的記錄,或者通過人工去了解所在城市的旺季與淡季。比如,外面有櫻花,可能會有很多人來。但他們沒有全景旅行的數(shù)據(jù),很難去做精確的供需預(yù)估。
通過我們剛才說的旅行的大腦,因為我們有全景數(shù)據(jù)及更深的算法,我們就可以精確地幫助這些酒店及航空公司設(shè)置價格。
還有一點,只知道宏觀的數(shù)據(jù)還不夠,因為很多時候你在一個競爭圈,你需要把自己的數(shù)據(jù)和競爭對手的數(shù)據(jù)做比較分析,這非常重要。所以說,通過數(shù)據(jù)的分析,旅行的大腦釋放了數(shù)據(jù)能力,幫助我們?nèi)ジ玫刭x能行業(yè)。
旅行大腦賦能行業(yè)及個人
剛才是對行業(yè)的幫助,再來看對個人的幫助。借助交易數(shù)據(jù),我們知道你住過什么酒店、喜歡什么星級、接受什么價位、喜歡什么服務(wù)。我們同時結(jié)合另一端,會知道不同的酒店可以提供什么樣的服務(wù),大家對它的點評如何等等。
當(dāng)我們將這兩者的數(shù)據(jù)結(jié)合起來,再借助精準(zhǔn)推薦的算法,就可以幫助我們的用戶方便快捷地找到他們需要的商品。這是一個智能推薦的例子。
我們來看一個文本處理的例子。大部分酒店都有一些標(biāo)準(zhǔn)信息,比如酒店位置、價格、星級、服務(wù)水平……這些信息非常有用,是大家訂酒店的依據(jù)。但酒店其實有非常多藏得特別深但是也特別有用的信息,這些大家平時都看不到。
比如說酒店的早餐怎么樣,酒店服務(wù)員的笑容是否親切,陽臺是否有吊椅,這些都不是標(biāo)準(zhǔn)信息,但我們可以借助用戶留下來的點評,用算法去把這些特色挖掘出來,有些人可能就特別在意這些。
大家知道現(xiàn)在的短視頻非常流行,我們新一代的社交軟件是以短視頻來展現(xiàn)的,但不是每一家酒店都可以制作一個非常精良的短視頻。但是,每一個酒店它都會提供很多圖片,我們就會把酒店上傳的各種圖片拿過來做一個挖掘。
最新的算法是會把一張圖片拿過來,先拿一點最原始的信息,即每一個像素,然后通過這些像素去進一步學(xué)習(xí),得到某些具體的小東西的輪廓,再通過這個輪廓去學(xué)習(xí)到不同的一些部位組成的部件,最終判斷這張圖片到底在說什么。
把這個概念應(yīng)用到我們剛才的場景里面去,我們不僅可以判斷這是酒店的大堂、臥室、衛(wèi)生間等等,我們還可以推斷每一張圖片的美觀度,判斷一張圖片是否會讓大家欣賞,讓大家喜歡。
當(dāng)算出這些有美觀度的圖片后,我們就會設(shè)計一個小視頻,這個視頻會包含酒店不同的部分,每一部分用什么樣的圖片,我們都會拍成一段小的視頻,方便用戶在十幾秒的時間里快速了解酒店,從而縮短用戶時間。
我們再看一下客服??头鋵嵤且粋€非常古老的行業(yè),在旅行中我們需要很多的服務(wù),要通過人工智能去替代人工客服是一件非常難的事情。
我們有一個龐大且復(fù)雜的知識圖譜。
這個圖譜告訴你,在某一次出國游的時候,第一步你要做一個簽證;
這個圖譜會告訴你,在某一個季節(jié)某一個地方櫻花正盛開;
這個圖譜會告訴你,對你這一類型的人,可能這種酒店是最適合你的。
這其實就是結(jié)合了所有的數(shù)據(jù)、信息、算法,我們做了這樣一個圖譜。
這樣的圖譜能干什么?如果你不知道想去哪兒玩,它可以推薦給你;你決定了去哪兒玩,它可以給你推薦酒店,機票;在你訂酒店及機票的過程中如果出現(xiàn)一些小意外,必須改簽,它也可以幫你做到。
你可能到了一個地方,你去住宿了之后,你想知道酒店周邊有什么好玩的,你甚至想找一些當(dāng)?shù)氐南驅(qū)?,在這樣一個龐大和強力的知識圖譜的支撐下,人工智能的客服就可以幫助你做到所有這一切。
數(shù)據(jù)讓旅行更幸福
數(shù)據(jù)和算法可以幫助你的旅行更加便捷,體驗更好。旅行把我們帶向遠(yuǎn)方,很多時候我們不止是要遠(yuǎn)方,我們還要詩。通過剛才的知識圖譜,我們就會做一個小詩集,幫你去寫一首詩,不止幫你去到遠(yuǎn)方,還要幫你和詩一直相伴。
數(shù)據(jù)可以讓旅行變得更加幸福,可是數(shù)據(jù)也是一個雙刃劍。更大的能力就意味著更多的責(zé)任。
在現(xiàn)在這個數(shù)據(jù)時代,每個企業(yè)都擁有著大量的用戶數(shù)據(jù),這些數(shù)據(jù)可以用來去改善企業(yè),但是如果這些數(shù)據(jù)用得不好,不夠克制,也是非常危險的一個事情。接下來我們分享一些在這方面的考慮和實踐。
透明
我們每一個人的數(shù)據(jù)被獲取的時候,我們都有權(quán)知道自己的什么的數(shù)據(jù)被收集了,這些數(shù)據(jù)又將會被怎么使用,所有的這些信息對你都應(yīng)該是透明的。你不應(yīng)該處在一個毫不知情就被拿走數(shù)據(jù)的環(huán)境下。
安全
數(shù)據(jù)到底應(yīng)該存儲在什么特殊的地方,敏感的信息又該如何加密,我們該如何控制數(shù)據(jù)訪問的權(quán)限,這是每一個企業(yè),每一個在用數(shù)據(jù)去做事情的人都應(yīng)該考慮的點。
溫度
當(dāng)我們在傳遞數(shù)據(jù)的同時,也是在傳遞我們每個人的個性。當(dāng)我們拿到數(shù)據(jù)之后該怎么應(yīng)對?是要用冰冷的算法去應(yīng)對我們這些有活力的人嗎?這是錯的,人工智能應(yīng)該是有溫度的。
人工智能的客服機器人確實可以給你提供非常好的體驗,但在一些特別緊急的情況下,我們并不喜歡去跟一個機器人聊天,我們還是希望這個產(chǎn)品背后的客服是個真實的人,他不僅可以了解我的需求,還能體會到我的情感。
去年在整個旅行行業(yè)發(fā)生了很多的事情,我們看到了九寨溝的地震,我們看到了拉斯維加斯的槍擊案,我們看到了很多人類不該有的災(zāi)難。這些災(zāi)難的現(xiàn)場都有著我們的游客。
人工智能可以幫助我們更好地掌握他們的情況,但是人工智能沒有辦法幫助我們把他們從一個個困境里救出來,把他們帶到出發(fā)前的地方,帶回他們的家里去。這個時候,我們就需要人工智能和人結(jié)合在一起,我們要提供有溫度的服務(wù)。
今日互動話題:
數(shù)據(jù)應(yīng)用下,你的旅行方式產(chǎn)生了哪些改變?
編輯丨方芳
校對丨其奇
這是個沒有隱私的時代,只有這個辦法可以終結(jié)它