解放日報記者 柳森
近兩三年,基于開放數(shù)據(jù)的各種創(chuàng)新應(yīng)用大賽非常奪人眼球。與此同時,這把“火”也燒到了城市管理、城市規(guī)劃利用數(shù)據(jù)工具輔助決策領(lǐng)域。一時間,類似“城市數(shù)據(jù)師”、“城市數(shù)據(jù)俠”、“城市數(shù)據(jù)派”、“城市數(shù)據(jù)團”這樣的酷炫提法層出不窮。
大數(shù)據(jù)變革時代,數(shù)據(jù)分析和二次開發(fā),可以為“城市變得更美好”貢獻哪些價值?
在去年6月啟動的上海開放數(shù)據(jù)創(chuàng)新應(yīng)用大賽(SODA)中,由上海對外經(jīng)貿(mào)大學(xué)工商管理學(xué)院副教授陳瑤博士領(lǐng)銜、基于交通大數(shù)據(jù)進行價值挖掘的參賽項目“優(yōu)行地鐵”獲得優(yōu)勝獎。她用自己近一年來的親歷告訴《解放周一》記者:數(shù)據(jù)一定可以發(fā)現(xiàn)城市未來,但這個過程,并不容易。
“數(shù)據(jù)俠”風(fēng)行的土壤
解放周一:這兩三年,大數(shù)據(jù)熱也“燒”到了城市管理、城市規(guī)劃決策領(lǐng)域。這僅僅是因為“大數(shù)據(jù)”概念受熱捧嗎?
陳瑤:基于數(shù)據(jù)做決策,這在管理科學(xué)與工程學(xué)領(lǐng)域很早就有了,也是專門的一類研究。原先沒有那么大的影響力。這兩年能夠火起來,跟大數(shù)據(jù)概念的火絕對有關(guān)。但更深層的原因在于,我們整個社會方方面面經(jīng)過二十余年的信息化,不僅發(fā)展迅速,也在這個進程中,尤其是近十年,積累了大量的數(shù)據(jù)。
以前沒有那么海量數(shù)據(jù)的時候,大家拿一般的統(tǒng)計模型做一些分析研究。比如研究人流量,你去實地看、去抽樣、去數(shù)人頭,但現(xiàn)在已經(jīng)不需要了。把數(shù)據(jù)拉出來分析一下,就能一目了然。接下來的工作在于數(shù)據(jù)的轉(zhuǎn)化和價值挖掘。再加上“互聯(lián)網(wǎng)+”概念和創(chuàng)業(yè)創(chuàng)新受到高度關(guān)注。這種熱潮之下,數(shù)據(jù)會變得更可得,有更多數(shù)據(jù)被公開,也有更多數(shù)據(jù)進入流通領(lǐng)域,甚至可購買、可交易。
解放周一:有數(shù)據(jù),就能有有價值的數(shù)據(jù)挖掘與發(fā)現(xiàn)么?
陳瑤:未必。數(shù)據(jù)在質(zhì)量上會有差異,需要去分辨噪音、異常。我們做大數(shù)據(jù)的第一步,就是數(shù)據(jù)清理。清理中可以挖掘出很多有意思的問題和現(xiàn)象,然后可以從中尋找原因,或者進一步進行有意義的應(yīng)用開發(fā)。
目前在大數(shù)據(jù)行業(yè),發(fā)展得最快最多的,也就是業(yè)務(wù)爆發(fā)點,是做顧客人群的分析和標(biāo)簽,然后進行精準(zhǔn)營銷。以顧客的消費數(shù)據(jù)、互聯(lián)網(wǎng)行為數(shù)據(jù)為基礎(chǔ),不僅能挖掘出什么樣的人對什么樣的產(chǎn)品感興趣,還能推測這個顧客背后的人生軌跡和未來消費潛力。因為很有商業(yè)價值,變現(xiàn)也快,企業(yè)非常重視對這一塊的投入?,F(xiàn)在在大數(shù)據(jù)行業(yè)走在前列的公司,很多都走了精準(zhǔn)營銷這條路。
相較而言,基于數(shù)據(jù)輔助城市管理決策這塊(目前主要是圍繞城市治理、安全、環(huán)保),就要落后很多。最根本的原因在于市場激勵機制沒有建立起來。說無利可圖或許有些淺薄,但現(xiàn)實就是如此。沒有一點情懷,很難把這方面的拓荒堅持下去。畢竟,無論是模型、算法研發(fā)還是應(yīng)用拓展,都需要投入相當(dāng)大的人力成本。
給地鐵擁堵做一次“體檢”
解放周一:但我們還是看到了你們的作品。一個為了提升市民乘坐地鐵出行體驗,鼓勵“智慧出行”和“綠色出行”,并希望能夠有助于提高上海這個超大型城市的人群風(fēng)險管理能力和運營效率的民生類公益項目——“優(yōu)行地鐵”?;诘臄?shù)據(jù)主要來自SODA大賽提供的公交一卡通乘客刷卡數(shù)據(jù)(2016年3月、2015年4月,精確到秒)。你們對這些數(shù)據(jù)感興趣的原始沖動來自哪里?
陳瑤:這個沖動其實非常簡單。就是我自己早高峰擠地鐵擠到想吐的時候,感到能夠獲得的信息非常不足,有時面對擁擠的人流還是挺害怕的。于是,我一邊擠地鐵,一邊琢磨:這地鐵到底有多擠,有沒有超載,有沒有安全隱患;人流峰值、波谷分別在什么時候,我有沒有可能錯峰出行;如果地鐵本身的客流負荷暫時無法改變,對乘坐舒適度非常敏感的出行者來說,比如老弱病殘孕、穿著正式地趕赴面試的、身體不適需要趕去求醫(yī)問藥的,可否改變自己的出行方案,做更聰明的乘客?
后來,我們看到SODA大賽公布出來的數(shù)據(jù),發(fā)現(xiàn)正好可以跟上述這些問題的求解匹配起來,我們就投入研究了。說得形象一點,我們想給地鐵擁堵做一次比較全面的“體檢”。
解放周一:通過“體檢”,有什么新的發(fā)現(xiàn)?
陳瑤:過去有不少針對地鐵擁堵問題的研究,但我們發(fā)現(xiàn),這些研究關(guān)注的數(shù)據(jù)比較“粗”,太就數(shù)據(jù)論數(shù)據(jù)。主要就是關(guān)注多少人進站、多少人出站。事實上,這一次大賽提供的內(nèi)容記錄上也只有進出站時間。那些其實都只是表面數(shù)據(jù)。如果你真的在乎乘客的出行體驗,對這個場景有更深入的感受和體會,就會發(fā)現(xiàn),每一個乘客出入地鐵站的路徑、在站時間、等待時間、那段時間的站內(nèi)人流情況、車廂客流負荷,都是非常重要的數(shù)據(jù)信息。
有了對這些關(guān)鍵數(shù)據(jù)的問題意識,我們團隊逐條分解了上億條乘客形成的歷史記錄,研發(fā)算法,估算了地鐵全網(wǎng)日內(nèi)客流等待時間、在站人數(shù)和車上人數(shù)。有了這個基礎(chǔ),可以實時對站內(nèi)乘客人數(shù)進行分級評估,從而對地鐵大客流進行更有效的管理、疏導(dǎo)、預(yù)警。
通過這段時間的數(shù)據(jù)梳理與分析,有幾點發(fā)現(xiàn)可以與大家分享——
比如,每周一到周五,即工作日,上海市民的地鐵通勤人流數(shù)據(jù)非常規(guī)律。這提示我們,一條地鐵線路的擁堵情況,同其沿途的職住區(qū)域分布直接相關(guān)。換言之,該區(qū)域有沒有居民聚居區(qū),有沒有職場人士大量出行,直接決定該區(qū)域的地鐵通行量。這也意味著,我們的城市管理者在進行地鐵規(guī)劃時,應(yīng)該把常住人口和非常住人口、目前周邊出行人流結(jié)構(gòu)和未來的出行需求結(jié)構(gòu)一并考慮。
不重視目前出行需求面臨的主要矛盾,不預(yù)測未來潛在出行需求變化,都可能造成各種各樣的問題。比如九號線九亭到佘山的三個站,在當(dāng)初設(shè)計時,周邊居住區(qū)很少,與現(xiàn)在完全不同。
又如,我們現(xiàn)有的地鐵站線路越拉越長,但中間可供車輛調(diào)頭的車站太少。這帶來的問題是,假設(shè)客流集中在某段,列車就無法在這段區(qū)間內(nèi)調(diào)頭,不得不開到很遠的地方再倒回來。中間段的超負荷運載加上長距離往返,對車輛的損耗也大。這在未來的地鐵線路規(guī)劃和設(shè)計上,是一個非常值得重視的問題。
這次數(shù)據(jù)梳理還提示我們,類似松江九號線沿線大型居民社區(qū)聚集的情況,應(yīng)該在城市規(guī)劃和管理層面,提供給沿線居民和職場人士單線進城外的多種出行選擇。未來我們的城市邊界會繼續(xù)不斷向外擴張,在此大勢下,上述基于歷史數(shù)據(jù)的發(fā)現(xiàn)都是值得重視的。
改變出行生活的關(guān)鍵:需求管理
解放周一:在發(fā)現(xiàn)了上述問題后,你們的建議是什么?
陳瑤:從運營管理的理論分析來看,由于生產(chǎn)和消費的同時發(fā)生,服務(wù)系統(tǒng)運營管理中的核心問題,就是供求之間的平衡。當(dāng)前,在產(chǎn)能供給上,上海地鐵已經(jīng)投資巨大,但面對非常不平衡的高峰期出行需求仍顯產(chǎn)能不足。因此,對需求進行管理,就非常必要。
需求管理的核心是主動影響顧客需求,削峰填谷,平穩(wěn)需求。那么,我們所做的,就是為市民提供詳細的地鐵出行信息、擁擠預(yù)測和路線優(yōu)化,幫助乘客做出理性決策,主動錯峰出行。
比如,早十分鐘或者晚十分鐘坐某段地鐵,就可以不那么擠。提示之下,一些愿意提早出行的人,就可以做出調(diào)整。
又如,9號線早高峰是非常擠的。于是,我們在公眾號平臺上建議松江大學(xué)城的大學(xué)生:如果你要去虹橋辦事或者去虹橋火車站,干脆坐松江南站的高鐵,貴一點,但十分鐘就可以到。記得有一個學(xué)生給我發(fā)消息說,“自從看了陳老師的報告以后,我每次進城都坐高鐵”。還有同事給我留言,晚十分鐘錯峰出行提高了她的生活質(zhì)量。
這只是一些非常小的改變,但確實能改變你的體驗,改善人們的生活質(zhì)量。很多時候,我們可以有很多種出行選擇,只是你沒有想到。
傾聽來自數(shù)據(jù)的聲音
解放周一:你認同“數(shù)據(jù)可以發(fā)現(xiàn)城市未來”這個命題嗎?在過往的研發(fā)過程中,如果要通過數(shù)據(jù)發(fā)現(xiàn)城市未來,你遇到的最力不從心之處,或者說最大的困難,是什么?
陳瑤:大數(shù)據(jù)行業(yè)的競爭主要在兩個方面:數(shù)據(jù)和算法,尤其是前者。數(shù)據(jù)滯后、短期、不完整,都會影響結(jié)果。如果沒有好的數(shù)據(jù)、長期穩(wěn)定的數(shù)據(jù)來源,再有意義的問題發(fā)現(xiàn)、再好的算法都將是巧婦難為無米之炊。
另一個比較大的困難,來自項目的落地,來自我們通過數(shù)據(jù)挖掘出來的結(jié)果,未必能得到實際使用,得到進一步的調(diào)研和核實。特別是,相關(guān)領(lǐng)域的城市管理者,未必能理解和充分信任我們所使用的數(shù)據(jù)處理方法、研究分析所得。而像我們針對市民地鐵出行這種城市管理問題提出解決方案的,如果沒有政府的支持和推動,很難落地。畢竟我們是外部研究者,真正實際使用的是他們。
所以,你說數(shù)據(jù)可以發(fā)現(xiàn)城市未來嗎,我覺得答案是一定可以。但城市未來的決策權(quán)掌握在管理者的手中。數(shù)據(jù)是礦,算法是鏟子,最后挖出的金子要不要用、怎么用,是城市管理者的決定。非常希望我們的城市管理者能更多傾聽來自數(shù)據(jù)的聲音。
解放周一:如何理解你所說的“更多傾聽來自數(shù)據(jù)的聲音”?
陳瑤:對政府部門而言,進行數(shù)據(jù)應(yīng)用開發(fā),將基于數(shù)據(jù)的決策更多應(yīng)用于城市管理、城市規(guī)劃中,并不是簡單的趕時髦,而是開拓治理思路和治理方法的一種途徑。
簡單來說,早前管理者的決策是自下而上地讓下級提交各種報表、報告。而進入大數(shù)據(jù)時代,如果讓決策者看到的,是直接經(jīng)過自動化處理以后得到的數(shù)據(jù)結(jié)果,不僅不再需要通過下級去周轉(zhuǎn),數(shù)據(jù)本身的真實性和可靠性也更高。
未來的決策者不能只看報告,至少要看一張?zhí)峁┤皵?shù)據(jù)、時間空間維度可以自由拉動的可視化視圖,還可以設(shè)計算法做中短期預(yù)測。如果數(shù)據(jù)放在那里不去用,不拿來發(fā)現(xiàn)問題、解決問題,不用來提高決策效率、決策水平,會很可惜。
這一次,單從SODA大賽開放的數(shù)據(jù)就能發(fā)掘出那么多有價值的問題,何況是存在于社會生活方方面面的數(shù)據(jù)。有些數(shù)據(jù)如果不適合公開,完全可以自建團隊做價值挖掘。當(dāng)然自建團隊對技術(shù)人才儲備要求很高,給出的薪水如果達不到行業(yè)平均水準(zhǔn),就很難有吸引力。數(shù)據(jù)改變城市的未來,需要數(shù)據(jù)開發(fā)者和城市管理者的合作,專業(yè)化的效果更好、效率更高。
◇鏈接◇
城市軌跡大數(shù)據(jù)是個怎樣的“富礦”
■本報記者 柳森 整理
近年來,隨著無線通信的廣泛應(yīng)用,車輛GPS、手機信令、交通卡等空間行為大數(shù)據(jù),被用來非常精確地揭示人類行為移動模式,從而解釋城市的社會經(jīng)濟環(huán)境。如今,可利用的空間行為大數(shù)據(jù)已經(jīng)包括:移動電話數(shù)據(jù)、車輛軌跡數(shù)據(jù)、智能卡數(shù)據(jù)、Wi-Fi和藍牙數(shù)據(jù)、社交媒體用戶數(shù)據(jù)等。
這些空間行為大數(shù)據(jù),為確定人類的生活模式提供了一個非常有前途的來源。由于大數(shù)據(jù)可以記錄連續(xù)的空間行為,且隨時間和空間精確變化,研究使用這些數(shù)據(jù),可以細致揭示城市居民個體不同空間和時間下的交通出行模式。
近幾年,包含交通智能卡和手機運營商數(shù)據(jù)在內(nèi)的城市軌跡大數(shù)據(jù),正在國內(nèi)外成為科學(xué)研究和商業(yè)應(yīng)用的熱點。隨著數(shù)據(jù)處理、模型設(shè)計、統(tǒng)計驗證方法的不斷成熟,大數(shù)據(jù)正被不斷應(yīng)用到城市生活不同場景的實踐中。
交通智能卡數(shù)據(jù)
交通智能卡(Smart card)最初應(yīng)用于公共交通的自動收費系統(tǒng),如公共汽車、地鐵和停車場。智能卡系統(tǒng)也被引入商店、餐館和醫(yī)院。如今,幾乎在世界各大城市都有自己的智能卡系統(tǒng)。
雖然交通智能卡的主要目的是收集收入信息,但同時也產(chǎn)生了大量非常詳細的交易數(shù)據(jù)信息。這些數(shù)據(jù)既可以幫助公交系統(tǒng)的日常運營,也可以用于相關(guān)網(wǎng)絡(luò)的長期戰(zhàn)略規(guī)劃??蓪崿F(xiàn)三級管理的各種用途:戰(zhàn)略(中長期規(guī)劃)、戰(zhàn)術(shù)(服務(wù)調(diào)整和網(wǎng)絡(luò)發(fā)展)和運作(客流統(tǒng)計和績效指標(biāo))。
一般,智能卡包含信息包括卡ID、交易數(shù)據(jù)(時間、類型和車費)、旅行數(shù)據(jù)(出行模式、時間、票價、車站和路線ID)和個人識別數(shù)據(jù)。因此,智能卡中的數(shù)據(jù)可以用于出行需求預(yù)測或個人出行模式檢測。然而,不同于基于距離的票價,智能卡數(shù)據(jù)沒有登記行程,僅有出入站地點。因此,使用智能卡數(shù)據(jù)的一個主要挑戰(zhàn),是如何識別一個完整的旅行軌跡、估計各種多通道傳輸?shù)目赡堋?br> 曾有學(xué)者使用倫敦智能卡數(shù)據(jù)中的個人旅行信息,揭示城市的結(jié)構(gòu),提供新的方法來模擬城市系統(tǒng)的流量;基于北京市14個工作日的地鐵刷卡客流量數(shù)據(jù),將195個地鐵站點分為居住導(dǎo)向型、就業(yè)導(dǎo)向型、職住錯位型、錯位偏居住型、錯位偏就業(yè)型、混合型、綜合型及其他型8種不同類型;使用上海申通地鐵數(shù)據(jù),對世博會期間上海軌道交通客流特征進行統(tǒng)計分析。所有這些實證研究表明,智能卡數(shù)據(jù)對理解城市系統(tǒng)的動態(tài)(各種旅行行為和交通規(guī)劃)非常有效。
國內(nèi)外學(xué)者在公共交通中使用智能卡數(shù)據(jù)進行的研究,主要分為三大類:戰(zhàn)略層面上,涉及長期的網(wǎng)絡(luò)規(guī)劃、客戶行為分析和需求預(yù)測;戰(zhàn)術(shù)層面上,重點是地鐵時刻表調(diào)整、縱向和個別的出行模式;業(yè)務(wù)層面,研究相關(guān)的供應(yīng)和需求指標(biāo),以及如何完善智能卡系統(tǒng)可操作性。一旦智能卡搭載上持卡人資料,比如采用使用者實名制登記,其所呈現(xiàn)的信息的社會人口屬性會更強。
手機運營商數(shù)據(jù)
無論在國內(nèi)還是國外,移動手機的運營商數(shù)據(jù),作為一種軌跡數(shù)據(jù),也已被廣泛用于各類研究和商業(yè)應(yīng)用。
手機數(shù)據(jù)有兩種類型:基于信元塔的數(shù)據(jù),主要包含小區(qū)塔流量和切換信息;基于移動電話的用戶數(shù)據(jù),通常包含匿名用戶ID、小區(qū)塔ID,以及電話、位置、日期和時間的信息。目前,出于數(shù)據(jù)類型和研究目的的不同,用來處理和分析手機數(shù)據(jù)的方法,包括傳統(tǒng)的數(shù)據(jù)挖掘技術(shù),如聚類方法和基于規(guī)則的算法,新技術(shù)有可視化工具和復(fù)雜的機器學(xué)習(xí)方法。
手機數(shù)據(jù)在出行交通行為研究中最基本的應(yīng)用是檢測逗留(訪問)和提取出行次數(shù)。通常情況下,結(jié)合連續(xù)定位數(shù)據(jù)和歷史定位數(shù)據(jù)、計算個體在每個區(qū)域的定位頻率,可以檢測該用戶的停留情況。只需要手機使用的四個時空點,就能定義一個人的活動痕跡。
用戶的交通方式,可以使用蜂窩網(wǎng)絡(luò)的數(shù)據(jù),根據(jù)連接信號強度的波動變化率,做較粗略的估計。目前通過這類數(shù)據(jù)可識別的出行方式,主要包括停止、步行和機動車出行方式。
范圍更廣的交通方式,可以使用手機內(nèi)置的GPS和運動傳感器,采集更準(zhǔn)確的定位和運動狀態(tài)信息,判斷行駛速度和可能的方式。例如,利用智能手機內(nèi)置GPS和加速度傳感器收集的數(shù)據(jù),可以確定五種運輸方式,包括步行、跑步、騎自行車、停止、開車;區(qū)分八種出行方式,包括汽車、自行車、公共汽車、電車、火車、地鐵、步行、摩托車等。應(yīng)用于上述數(shù)據(jù)分析的分類技術(shù),包括決策樹分類器、隱藏的馬爾可夫模型、基于規(guī)則的分類器、人工神經(jīng)網(wǎng)絡(luò)、貝葉斯分類器等。
城市動力學(xué)研究早已開始大規(guī)模使用手機數(shù)據(jù)。曾有一個名為“移動風(fēng)景”的項目,使用手機數(shù)據(jù)可視化展示了米蘭城市在時間和空間上的演化?!皩崟r羅馬項目”,則使用羅馬的手機和出租車數(shù)據(jù),描繪了城市脈搏。隨著手機運營商數(shù)據(jù)的部分開放,國內(nèi)對手機信令的研究近幾年開始增多,主要集中在城市規(guī)劃和交通領(lǐng)域中。比如,基于手機信令,對軌道交通早高峰客流和居民的職住通勤關(guān)系、大都市圈規(guī)劃進行研究。
傳統(tǒng)的出行行為研究很難做到這樣幾乎覆蓋到整個人口的樣本。而手機數(shù)據(jù)最獨特、最吸引人的特點,就是它們的普及規(guī)模。由于其為研究者提供了縱向和個別的大量細節(jié),因而非常適合用來研究城市管理問題。
?。ǜ兄x陳瑤博士為本文提供學(xué)術(shù)支持)
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。