智東西(公眾號(hào):zhidxcom)
文 | 心緣
智能金融江湖百家爭(zhēng)鳴,多數(shù)玩家背后卻有同一個(gè)后盾——英特爾至強(qiáng)平臺(tái)。
很多傳統(tǒng)企業(yè)在將人工智能(AI)部署到自身業(yè)務(wù)時(shí),往往面臨如何將AI與現(xiàn)有高性能計(jì)算工作負(fù)載有效兼容的難題。另起爐灶成本太高,從零翻新基礎(chǔ)設(shè)施顯然也不現(xiàn)實(shí),而增強(qiáng)了深度學(xué)習(xí)能力的英特爾至強(qiáng)可擴(kuò)展處理器,專為在現(xiàn)有工作負(fù)載硬件上運(yùn)行復(fù)雜AI任務(wù)的需求而生。
短短幾年間,英特爾已經(jīng)潛移默化地服務(wù)了大半個(gè)AI金融圈。
這得益于英特爾CPU在計(jì)算基礎(chǔ)設(shè)施領(lǐng)域的根深蒂固、在AI領(lǐng)域的早早布局、在智慧金融實(shí)例的長(zhǎng)期摸索,形成一套獨(dú)具一格的“AI+金融”落地寶典。
如今,英特爾將這些經(jīng)驗(yàn)和智慧,以及典型的服務(wù)案例,都融入一本白皮書《英特爾中國金融行業(yè)AI實(shí)戰(zhàn)手冊(cè)》中,供金融從業(yè)者及AI開發(fā)者參考。
智慧金融快速成長(zhǎng),并不令人意外。
金融行業(yè)有幾大特點(diǎn):信息化起步早、數(shù)據(jù)積累豐富、數(shù)據(jù)標(biāo)準(zhǔn)化程度高、機(jī)械化工作方式占比高,這些與擅長(zhǎng)海量數(shù)據(jù)快速處理的AI天然契合。
金融界各種風(fēng)險(xiǎn)屢增,再加上金融普惠化和場(chǎng)景化創(chuàng)新成為必然,亟需對(duì)新技術(shù)的應(yīng)用。
比如,最讓金融界頭疼的“欺詐”問題,在過去幾年伴隨科技的進(jìn)步,新招數(shù)花樣百出,信用卡逾期凍結(jié)、死亡騙保、短信驗(yàn)證碼套現(xiàn)的場(chǎng)景屢見不鮮,不僅坑了眾多民眾,也將金融秩序攪成一灘渾水。
就在上周三,重慶警方赴柬押解回國的150名涉嫌電信網(wǎng)絡(luò)詐騙犯罪嫌疑人,涉及全國100余起案件,涉案金額近億元。
再比如逐漸增加的不良貸款,不僅侵蝕銀行利潤(rùn),占用寶貴信貸額度,還致使優(yōu)質(zhì)項(xiàng)目無法及時(shí)獲得信貸支持,更有甚者引發(fā)企業(yè)連鎖倒閉破產(chǎn),造成社會(huì)危機(jī)。
而此時(shí),AI浪潮襲來,為海量數(shù)據(jù)實(shí)時(shí)處理問題、經(jīng)驗(yàn)主義瓶頸、機(jī)械性工序耗費(fèi)人力等問題提供有效的解決方向。
AI與金融的跨界融合似乎已是大勢(shì)所趨,很多金融機(jī)構(gòu)或自己組建研發(fā)團(tuán)隊(duì),或與有AI基因的公司合作,幾乎能將AI元素融入從前端到后端的數(shù)據(jù)分析、風(fēng)險(xiǎn)預(yù)測(cè)、智能客服等金融業(yè)務(wù)全流程。
▲金融行業(yè)AI場(chǎng)景
在前端,計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理等感知類技術(shù)盤踞,常見的應(yīng)用有身份驗(yàn)證、客服機(jī)器人等。
在中臺(tái),AI主要用于提高信息分析決策效率,比如多元化分析評(píng)估客戶行為、提升個(gè)性化服務(wù)、降低欺詐風(fēng)險(xiǎn)等。
在后端,大量高度重復(fù)性工作被機(jī)器取代,在效率、準(zhǔn)確性和安全性上均較原有人工方案明顯提升。
智慧金融出現(xiàn)之前,互聯(lián)網(wǎng)金融還是金融行業(yè)的重頭戲。
彼時(shí)面對(duì)極速增長(zhǎng)的數(shù)據(jù),挑戰(zhàn)不斷出現(xiàn):
比如,數(shù)據(jù)資料是靜態(tài)的,無法得知實(shí)時(shí)發(fā)生的數(shù)據(jù)情況,動(dòng)態(tài)數(shù)據(jù)模式顯然已成為金融機(jī)構(gòu)提高競(jìng)爭(zhēng)力的必競(jìng)之處。另外,數(shù)據(jù)造假門檻和成本都越來越低,但數(shù)據(jù)真實(shí)性鑒別成本卻逐漸上漲。
深度學(xué)習(xí)可以將大量非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為有價(jià)值的智能,對(duì)風(fēng)險(xiǎn)預(yù)測(cè)、實(shí)時(shí)分析、自動(dòng)交易、防欺詐等增加效益。
▲當(dāng)前反欺詐模型常見AI算法
不過,深度學(xué)習(xí)也有其應(yīng)用瓶頸,在一些特定情況,比如較小的數(shù)據(jù)集、成本受限,可解釋性強(qiáng)的傳統(tǒng)機(jī)器學(xué)習(xí)方法通常會(huì)被比深度學(xué)習(xí)有更好的表現(xiàn)。
另外企業(yè)引入AI能力時(shí),通常不僅要考慮高性能,還要考慮成本問題。深度網(wǎng)絡(luò)對(duì)算力的要求,往往使之需耗費(fèi)昂貴的硬件成本,而有些計(jì)算任務(wù),傳統(tǒng)機(jī)器學(xué)習(xí)算法完全可以勝任,不僅能以更快的速度完成迭代,而且大大降低計(jì)算成本。
現(xiàn)在學(xué)術(shù)界、工業(yè)界都在推崇深度學(xué)習(xí)+機(jī)器學(xué)習(xí)的混合方式,而CPU平臺(tái)非常適合作為這一方式的算力基礎(chǔ)。無論是深度學(xué)習(xí)還是機(jī)器學(xué)習(xí),英特爾均對(duì)其做了相應(yīng)的改造,使之能勝任更高效的推理性能。
回到成本問題上,多數(shù)金融機(jī)構(gòu)不愿意走完全自研之路。這主要是因?yàn)橥度氤杀敬?、時(shí)間周期長(zhǎng),從上層AI應(yīng)用到底層基礎(chǔ)設(shè)施,整一套智慧化升級(jí)流程下來,試錯(cuò)成本高。
在這一背景下,英特爾開始為國內(nèi)外的AI金融發(fā)展起到重要的助推作用,幫助金融企業(yè)在既有IT基礎(chǔ)設(shè)施的基礎(chǔ)上,更快、更靈活、更低風(fēng)險(xiǎn)的增加AI能力。
入局AI+金融,英特爾有天然的優(yōu)勢(shì)。
在AI推理市場(chǎng),英特爾至強(qiáng)處理器的普及率非常高,為80%-90%的AI推理助力。
在此基礎(chǔ)上,英特爾第二代至強(qiáng)可擴(kuò)展處理器已經(jīng)問世,將性能比前代產(chǎn)品提升25%-35%,且特意針對(duì)AI應(yīng)用做了優(yōu)化,內(nèi)置矢量神經(jīng)網(wǎng)絡(luò)指令(VNNI),擴(kuò)展了英特爾AVX-512,優(yōu)化其AI推理能力。
圍繞至強(qiáng),英特爾推出一系列先進(jìn)的內(nèi)存、存儲(chǔ)、網(wǎng)絡(luò)和安全等技術(shù)及產(chǎn)品,進(jìn)一步加固數(shù)據(jù)處理優(yōu)勢(shì)。
其中,傲騰數(shù)據(jù)中心級(jí)持久內(nèi)存當(dāng)屬英特爾革命性的產(chǎn)品,通過創(chuàng)建新的存儲(chǔ)層,填補(bǔ)內(nèi)存-存儲(chǔ)架構(gòu)間的空白,它能部分替代內(nèi)存,同時(shí)比內(nèi)存更高性價(jià)比,并針對(duì)第二代至強(qiáng)可擴(kuò)展處理器做了優(yōu)化。
同樣,英特爾傲騰固態(tài)盤也為消除數(shù)據(jù)中心存儲(chǔ)瓶頸而生,采用創(chuàng)新3D XPoint存儲(chǔ)介質(zhì),從而加快應(yīng)用速度,降低延遲敏感型工作負(fù)載的事務(wù)處理成本,有效改善數(shù)據(jù)中心總擁有成本。
除了硬件平臺(tái),英特爾也打造了一套與硬件適配的AI框架、庫和工具集,既能最大程度挖掘硬件算力,又能降低用戶使用門檻。
英特爾面向TensorFlow、MXNet、PyTorch、Caffe等主流深度學(xué)習(xí)框架做了優(yōu)化,設(shè)計(jì)了MKL-DNN性能增強(qiáng)庫,以提升這些框架在英特爾架構(gòu)基礎(chǔ)設(shè)施上的運(yùn)行速度。
目前,MKL-DNN已成為眾多深度學(xué)習(xí)框架在CPU上的基本配置。
另外,考慮到很多用戶需要兼顧大數(shù)據(jù)分析和AI處理,英特爾將二者無縫集成到一個(gè)統(tǒng)一的平臺(tái)Analytics Zoo中,該平臺(tái)基于英特爾至強(qiáng)處理器平臺(tái),并融合了MKL-DNN等多種軟件庫,可大幅提升訓(xùn)練和推理速度。
這樣一來,開發(fā)者無需移動(dòng)數(shù)據(jù),節(jié)省了硬件管理和學(xué)習(xí)新語言的時(shí)間,在提高部署效率和可擴(kuò)展性、降低總擁有成本的同時(shí),還不會(huì)影響計(jì)算效率與性能。
針對(duì)邊緣側(cè)的視覺處理提速,英特爾還特意推出OpenVINO工具套件,通過英特爾AVX-512以及采用VNNI的英特爾深度學(xué)習(xí)加速技術(shù),在英特爾架構(gòu)平臺(tái)上,將計(jì)算機(jī)視覺相關(guān)深度學(xué)習(xí)性能提升19倍以上。
OpenVINO基于通用API接口在CPU、GPU、FPGA、VPU等各種硬件設(shè)備上均可運(yùn)行。借助這一工具套件,開發(fā)者無需改變軟件,即可快速完成硬件升級(jí)和算法移植,
紙上得來終覺淺,英特爾還有一大優(yōu)勢(shì),即是在過去幾年和金融客戶的合作實(shí)踐中,積累了大量AI部署的經(jīng)驗(yàn),能為AI基礎(chǔ)設(shè)施硬件和技術(shù)套件的規(guī)劃提供針對(duì)性的方案,如中國銀聯(lián)、中國人壽、中國平安等都是英特爾的生態(tài)伙伴。
經(jīng)過和金融客戶的廣泛合作,英特爾從對(duì)金融行業(yè)痛點(diǎn)的了解逐漸深入,針對(duì)常見的反欺詐和信貸逾期兩類問題,研究出一些經(jīng)過驗(yàn)證的有效解法。
面對(duì)“欺詐”這片難以打擊的黑灰產(chǎn),金融產(chǎn)業(yè)也不得不拿起新的武器——金融反欺詐應(yīng)用模型,和各種風(fēng)險(xiǎn)行為斗智斗勇。
中國銀聯(lián)是國內(nèi)唯一一個(gè)成功連接全國各地不同銀行自動(dòng)取款機(jī)的銀行網(wǎng)絡(luò),每年要處理200億單支付業(yè)務(wù),其中支付渠道正趨于多樣化,也帶來更大的風(fēng)控壓力。
▲中國銀聯(lián)電子支付研究院智能分析服務(wù)平臺(tái)架構(gòu)圖
在模型設(shè)計(jì)上,英特爾發(fā)現(xiàn)三個(gè)“頑疾”:學(xué)習(xí)用戶行為的算法應(yīng)用時(shí)間不足、用戶行為交易數(shù)據(jù)不足、正常和非正常交易數(shù)據(jù)不平衡。
傳統(tǒng)反欺詐模型都是基于規(guī)則算法,需定期耗費(fèi)大量資源總結(jié)交易業(yè)務(wù)和更新規(guī)則,造成資源消耗和增加時(shí)延。
深度學(xué)習(xí)模型的優(yōu)勢(shì)是能對(duì)規(guī)則自我學(xué)習(xí),但單一深度學(xué)習(xí)模型不擅長(zhǎng)單筆交易內(nèi)的特征學(xué)習(xí)。
針對(duì)這一問題,中國銀聯(lián)和英特爾的思路是融合學(xué)習(xí),他們提出創(chuàng)新的“三明治”多層反欺詐偵測(cè)模型“GBDT->GRU->RF”模型。
▲GBDT->GRU->RF三明治結(jié)構(gòu)反欺詐模型
循環(huán)神經(jīng)網(wǎng)絡(luò)GRU模型,是反欺詐AI應(yīng)用中常用的方案,新的三層方案并沒有直接使用GRU進(jìn)行欺詐判別,而是將其作為模型的中間層,前端通過英特爾Analytics Zoo工具,引入GBDT模型進(jìn)行特征優(yōu)化,后端疊加隨機(jī)森林模型。
新風(fēng)控系統(tǒng)在短短數(shù)月就達(dá)到最佳訓(xùn)練模式,相比基于規(guī)則的風(fēng)控系統(tǒng),新系統(tǒng)涵蓋率高達(dá)60%,精確率實(shí)現(xiàn)20%。
▲GBDT->GRU->RF三明治結(jié)構(gòu)反欺詐模型評(píng)估效果
數(shù)據(jù)非平衡性同樣是反欺詐應(yīng)用常見問題,英特爾也提供相應(yīng)建議,如在采樣和訓(xùn)練期間,可基于對(duì)數(shù)據(jù)量大的正常樣本正常采樣、提高欺詐樣本權(quán)重、隨機(jī)打亂次序多次訓(xùn)練欺詐樣本的策略。
此外,在實(shí)踐過程中,英特爾發(fā)現(xiàn)算法準(zhǔn)確度會(huì)受不同方法組合的次序的影響。經(jīng)測(cè)試,在2個(gè)特征內(nèi)提前特征性的方法間,加入特征間提取特性的方法,準(zhǔn)確率最高。三明治結(jié)構(gòu)還使用旁路加強(qiáng)特征重用。
銀聯(lián)的訓(xùn)練集群全部采用了英特爾至強(qiáng)處理器平臺(tái),上述整套風(fēng)控系統(tǒng)均基于英特爾Apache Spark計(jì)算集群和BigDL深度學(xué)習(xí)平臺(tái),由英特爾設(shè)計(jì)架構(gòu)和提供數(shù)據(jù)建模、參數(shù)調(diào)優(yōu)等支持,中國銀聯(lián)已將該系統(tǒng)進(jìn)行封裝和整合,并以API接口形式提供智能分析解決方案。
除了反欺詐,信貸逾期風(fēng)險(xiǎn)同樣是長(zhǎng)期困擾金融界的癥候,信貸風(fēng)險(xiǎn)管控已成為銀行風(fēng)控系統(tǒng)的重要內(nèi)容。
信貸風(fēng)險(xiǎn)預(yù)測(cè)主要由兩類應(yīng)用場(chǎng)景,預(yù)測(cè)方案存在人工投入大、周期長(zhǎng)、質(zhì)量良莠不齊、受多種因素影響的問題,給銀行帶來成本和管理壓力。
目前業(yè)界常用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的方法來構(gòu)建預(yù)測(cè)模型,用NLP方法研究和預(yù)測(cè)環(huán)境數(shù)據(jù),英特爾在和金融用戶的合作探索中,選擇構(gòu)建基于LSTM和傳統(tǒng)機(jī)器學(xué)習(xí)的混合模型。
▲模型融合的整體結(jié)構(gòu)
其中,機(jī)器學(xué)習(xí)模型XGBoost是已經(jīng)被廣泛運(yùn)用到信貸逾期風(fēng)險(xiǎn)預(yù)測(cè)方案中。該模型由大量分類回歸樹集合成的強(qiáng)分類器,相比GBDT等機(jī)器學(xué)習(xí)方法,它有4個(gè)特點(diǎn):
1、支持并行計(jì)算,可充分利用處理器的多線程能力;
2、XGBoost在其代價(jià)函數(shù)中引入正則化,可有效控制模型的復(fù)雜度,防止過擬合;
3、支持列抽樣方式,可有效防止過擬合、降低計(jì)算復(fù)雜度;
4、對(duì)代價(jià)函數(shù)進(jìn)行二階泰勒展開,預(yù)測(cè)效果更強(qiáng)。
LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)重要的衍生模型,基于LSTM的深度學(xué)習(xí)方法可大幅提升時(shí)序分析工作的效率,但缺乏可解釋性;基于樹的傳統(tǒng)機(jī)器學(xué)習(xí)方法是信貸逾期風(fēng)險(xiǎn)與此模型常用的技術(shù),預(yù)測(cè)結(jié)果具備較高可解釋性。兩者訓(xùn)練結(jié)果進(jìn)行加權(quán)融合,準(zhǔn)確性和可解釋性均提高。
▲貸款逾期風(fēng)險(xiǎn)混合預(yù)測(cè)模型軟件棧
這一方案已在某銀行用戶處實(shí)踐部署,數(shù)據(jù)顯示,新方法比人工預(yù)測(cè)方案準(zhǔn)確性提升2倍,預(yù)測(cè)時(shí)延縮短到2天,在線預(yù)測(cè)方案的每筆預(yù)測(cè)時(shí)間小于1秒。雙方還計(jì)劃進(jìn)一步探索用NLP方法研究和預(yù)測(cè)環(huán)境數(shù)據(jù)。
除了幫助金融用戶構(gòu)建降低常見風(fēng)險(xiǎn)的模型,英特爾也幫助多家金融企業(yè)用英特爾開源“大數(shù)據(jù)分析 +AI” 平臺(tái)Analytics Zoo中的各種AI模型,優(yōu)化自身業(yè)務(wù)流程,通過更精準(zhǔn)的用戶行為分析,優(yōu)化服務(wù)質(zhì)量。
精準(zhǔn)營銷和個(gè)性化營銷正成為許多行業(yè)提高服務(wù)質(zhì)量的重要應(yīng)用?;诮鹑谛袠I(yè)較高信息化水平和數(shù)據(jù)優(yōu)勢(shì),AI在金融精準(zhǔn)營銷中的策略日益受到更多關(guān)注。
推薦模型一般分三類:協(xié)同過濾、基于內(nèi)容和混合系統(tǒng)。協(xié)同過濾依賴顯性反饋和隱形反饋,基于內(nèi)容的系統(tǒng)依賴大量特征值訓(xùn)練且會(huì)重復(fù)推薦,越來越多人開始研究基于深度學(xué)習(xí)的推薦模型。
NCF模型是目前最常用的深度學(xué)習(xí)推薦算法之一,將GMF結(jié)構(gòu)+多層神經(jīng)網(wǎng)絡(luò)融合,獲得更好的推薦效果。
▲神經(jīng)協(xié)同過濾(NCF)模型的示例
另外還有一種寬深學(xué)習(xí)模型,通過將深度神經(jīng)網(wǎng)絡(luò)和線性算法模型混合,創(chuàng)建效率更高的推薦系統(tǒng)。
這兩種模型先通過英特爾Analytics Zoo可以輕松構(gòu)建。比如中國人壽上海數(shù)據(jù)中心在做險(xiǎn)種推薦主要采用了NCF模型,經(jīng)評(píng)估,其推薦系統(tǒng)的命中率達(dá)99.8%,超過預(yù)期數(shù)值;萬事達(dá)優(yōu)化推薦服務(wù)時(shí)用了NCF和WAD模型,從驗(yàn)證結(jié)果來看,精準(zhǔn)度和召回率均相比ALS模型有明顯提升。
▲萬事達(dá)深度學(xué)習(xí)模型比ALS模型的改進(jìn)結(jié)果
車險(xiǎn)、健康險(xiǎn)等保險(xiǎn)各個(gè)險(xiǎn)種都對(duì)影像分析有巨大需求,其中健康險(xiǎn)技術(shù)難度非常高,需要保險(xiǎn)公司的工作人員具備專業(yè)病理知識(shí)和實(shí)踐經(jīng)驗(yàn),能準(zhǔn)確評(píng)估被保險(xiǎn)人疾病情況,AI真誠為有效的醫(yī)學(xué)影像判讀輔助手段。
ResNet是當(dāng)前應(yīng)用最廣泛的CNN特征提取網(wǎng)絡(luò),也是2D計(jì)算機(jī)視覺任務(wù)的主流神經(jīng)網(wǎng)絡(luò)之一。另外還有一種叫V-Net的完全CNN被用于處理3D影像數(shù)據(jù)。
面向英特爾架構(gòu)優(yōu)化的Caffe就為RESNET50網(wǎng)絡(luò)提供了優(yōu)化版本,而且加入層融合技術(shù),并支持INT8精度推理,從而實(shí)現(xiàn)更大幅度的性能提升。
▲面向英特爾架構(gòu)優(yōu)化的Caffe在至強(qiáng)可擴(kuò)展處理器
中國平安就利用ResNet+V-Net方案,以及面向英特爾架構(gòu)優(yōu)化的Caffe等框架,在2018年初的肺結(jié)節(jié)分析(LUNA)評(píng)測(cè)中,以95.1%和96.8%的精度,刷新了“肺結(jié)節(jié)檢測(cè)”和“假陽性篩查”的世界紀(jì)錄。
包括ResNet和V-Net在內(nèi),英特爾推出的工具套件在人臉檢測(cè)、比對(duì)、活檢等各模塊都有預(yù)訓(xùn)練好的算法模型,可以拿來即用,而且模型效果都經(jīng)過很多實(shí)踐驗(yàn)證。
在數(shù)據(jù)驅(qū)動(dòng)下的智能化浪潮中,英特爾正以至強(qiáng)CPU為核心技術(shù)支柱,不斷細(xì)化和填補(bǔ)軟硬件技術(shù)和產(chǎn)品布局,并在長(zhǎng)期與金融客戶的合作中,積累了大量的實(shí)踐經(jīng)驗(yàn)。
經(jīng)由合作伙伴的助力,英特爾正在著力將其技術(shù)盡可能大程度地轉(zhuǎn)化成智慧金融落地經(jīng)驗(yàn),打磨出具有針對(duì)性和借鑒價(jià)值的行業(yè)參考方案,推進(jìn)金融業(yè)的AI實(shí)踐與創(chuàng)新生態(tài)的構(gòu)建。
目前,AI在金融業(yè)的應(yīng)用還處于初級(jí)階段。
銀行、證券、保險(xiǎn)等各類金融業(yè)都在積極引入AI,把控風(fēng)險(xiǎn)、降低人力成本并洞察用戶需求,將AI技術(shù)理論轉(zhuǎn)化為實(shí)際經(jīng)濟(jì)價(jià)值,提升服務(wù)競(jìng)爭(zhēng)力。
但與此同時(shí),這些傳統(tǒng)金融企業(yè)也面臨著融合AI能力、升級(jí)原有IT基礎(chǔ)設(shè)施的壁壘,要加快金融業(yè)智能化建設(shè),像英特爾這樣能提供簡(jiǎn)化AI升級(jí)流程的企業(yè)正扮演著至關(guān)重要的角色。
聯(lián)系客服