很多人搞不清楚數(shù)據(jù)科學家、數(shù)據(jù)工程師和數(shù)據(jù)分析師三個角色的區(qū)別是什么,甚至有些還是數(shù)據(jù)科學從業(yè)者也經(jīng)?;鞛橐徽劊J為數(shù)據(jù)科學家、數(shù)據(jù)工程師和數(shù)據(jù)分析師三個角色可以互換。
這段視頻希望為大家解釋清楚三個角色的不同崗位、技能和職責。
首先說一下三個角色的崗位描述。
數(shù)據(jù)科學家采用先進的數(shù)據(jù)技術,如聚類、神經(jīng)網(wǎng)絡、決策樹等來獲得業(yè)務洞察力。在這個職位上,將成為團隊中最資深的人,并且應該在機器學習、統(tǒng)計和數(shù)據(jù)處理方面擁有深厚的專業(yè)知識。在收集數(shù)據(jù)分析師和數(shù)據(jù)工程師的意見后,將負責開發(fā)可操作的業(yè)務洞察力,具備數(shù)據(jù)分析師和數(shù)據(jù)工程師的技能,但對數(shù)據(jù)科學家來說,技能組合需要更加深入和詳盡。
數(shù)據(jù)工程師是數(shù)據(jù)分析師和數(shù)據(jù)科學家之間的中介。作為數(shù)據(jù)工程師,將負責為操作或分析目的配對和準備數(shù)據(jù)。這個角色需要在數(shù)據(jù)架構的構建、開發(fā)和維護方面有很多經(jīng)驗。這個角色負責研究大數(shù)據(jù),編寫數(shù)據(jù)報告,并將其發(fā)送給數(shù)據(jù)科學家進行分析。
數(shù)據(jù)分析師在數(shù)據(jù)分析團隊中擔任入門級角色。這個角色需要善于將數(shù)據(jù)轉(zhuǎn)換為組織中每個人都能理解的形式。此外,需要精通多個領域,包括Python等編程語言、Excel 等工具、數(shù)據(jù)處理、報告和建模的基礎知識。有了足夠的經(jīng)驗,可以逐漸從數(shù)據(jù)分析師晉升為數(shù)據(jù)工程師和數(shù)據(jù)科學家的角色。
接著,我們聊聊三個角色的技能組合。
必須的說,編碼是每個工作角色的核心。數(shù)據(jù)科學家也需要精通 Java、Python、SQL、R、SAS 等編程語言。此外,需要具備Hadoop、Spark 和Pig等大數(shù)據(jù)框架的工作知識。了解深度學習、機器學習等技術的基礎知識更可以推動職業(yè)生涯更上一層樓。
數(shù)據(jù)工程師的角色要求對 Java、SQL、SAS、Python 等編程語言有深入的了解。還應該擅長處理 Hadoop、MapReduce、Pig、Hive、Apache Spark、NoSQL和數(shù)據(jù)流等框架。
數(shù)據(jù)分析師技術含量稍低一點,屬于入門級角色,需要對SAS Miner、Microsoft Excel、SPSS、SSAS等工具有所了解。如果有 Python、SQL、R、SAS 和 JavaScript 的基本知識,那將是一個加分點。
第三,我們來聊聊三個角色的職責。
作為數(shù)據(jù)科學家,必須承擔的職責包括:
(1)管理、挖掘和清理非結構化數(shù)據(jù),為實際使用做好準備。
(2)開發(fā)可以在大數(shù)據(jù)上運行的模型
(3)理解和解釋大數(shù)據(jù)分析
(4)負責數(shù)據(jù)團隊并幫助他們實現(xiàn)各自的目標
(5)交付對業(yè)務成果有影響的結果
數(shù)據(jù)工程師角色所承擔的職責包括:
(1)數(shù)據(jù)挖掘從數(shù)據(jù)中獲得洞察力
(2)將錯誤數(shù)據(jù)轉(zhuǎn)換為可用于數(shù)據(jù)分析的形式
(3)編寫數(shù)據(jù)查詢
(4)維護數(shù)據(jù)設計和架構
(5)借助額外轉(zhuǎn)換負載 (ETL) 開發(fā)大型數(shù)據(jù)倉庫
作為數(shù)據(jù)分析師將必須承擔的職責包括:
(1)借助查詢從數(shù)據(jù)庫中收集信息
(2)啟用數(shù)據(jù)處理并匯總結果
(3)在他們的工作中使用基本算法,如邏輯回歸、線性回歸等
(4)在數(shù)據(jù)處理、數(shù)據(jù)可視化、探索性數(shù)據(jù)分析和統(tǒng)計方面擁有并展示深厚的專業(yè)知識
最后,我們來看看 三個角色的平均薪酬 。
一般,作為一名數(shù)據(jù)科學家平均每年可以賺取高達95萬+元的收入,數(shù)據(jù)工程師的平均年薪可達80萬+元的收入,數(shù)據(jù)分析師的平均年薪為46萬+元。
這個收入僅供參考,沒有達到的繼續(xù)加油,切記不可以拿著這個數(shù)字去找老板加薪啊。
總結來看,無論選擇哪種數(shù)據(jù)科學職業(yè)道路,數(shù)據(jù)科學家、數(shù)據(jù)工程師或數(shù)據(jù)分析師,哪種角色都很有前景。因為最近3-5年里,全球數(shù)據(jù)科技領域人才都存在巨大的缺口。具體多大缺口呢?2021年,工信部公布的數(shù)據(jù)顯示,到2025年,大數(shù)據(jù)核心人才缺口將高達230萬人,大數(shù)據(jù)產(chǎn)業(yè)市場規(guī)模也將會突破3萬億!又是一個萬億級的市場,大家可要抓住機會!