大數(shù)據(jù)文摘作品,轉(zhuǎn)載要求見文末
編譯 | 萬如苑 大餅
9大錯誤,1個對策!
《數(shù)據(jù)科學(xué)實訓(xùn)營第3期》
14次優(yōu)質(zhì)直播+14次云實驗室實訓(xùn)
24個案例練習(xí)+2個結(jié)業(yè)項目
助教全程輔導(dǎo)
快速解鎖數(shù)據(jù)科學(xué)全流程
距離優(yōu)惠截止僅剩 3 天
名額有限 欲報從速
詳情見文末
--------------
如果你希望在數(shù)據(jù)科學(xué)方面開始職業(yè)生涯,你可以通過避免以下9個代價大的初學(xué)者易犯錯誤,來減少你數(shù)天,數(shù)周甚至數(shù)月的痛苦折磨。
但是如果你不足夠小心,這些錯誤將會浪費你最寶貴的資源:你的時間、精力和動力。
我們將這9個錯誤分為三種類型:
學(xué)習(xí)中的錯誤
申請工作中的錯誤
工作面試中的錯誤
在學(xué)習(xí)數(shù)據(jù)科學(xué)時
第一種錯誤比較隱蔽很難被發(fā)現(xiàn)。 它產(chǎn)生于人們對數(shù)據(jù)科學(xué)相關(guān)領(lǐng)域的錯誤印象,并且會慢慢地不露聲色地耗盡你的時間和精力。
許多初學(xué)者陷入了理論研究并花費了太多的時間,包括數(shù)學(xué)相關(guān)的(線性代數(shù),統(tǒng)計學(xué)等)也包括機器學(xué)習(xí)相關(guān)的(算法,積分等)理論。
這種方法效率低下有三個主要原因:
首先,(學(xué)習(xí)理論)是緩慢而令人氣餒的。 如果你曾經(jīng)感到對所有東西都一頭霧水,你可能陷入了這個學(xué)習(xí)陷阱。
第二,你也不會記住這些概念。 數(shù)據(jù)科學(xué)是一個應(yīng)用領(lǐng)域,鞏固技能的最佳方法是實踐。
最后,你很可能失去動力然后放棄,如果你一直無法看到怎樣將你所學(xué)的知識聯(lián)系到現(xiàn)實世界的話。
傳統(tǒng)上這種重理論的研究方法在學(xué)術(shù)界較普遍,但大多數(shù)從業(yè)者還是更適合結(jié)果導(dǎo)向的思維模式。
為了避免這個錯誤:
平衡研究學(xué)習(xí)與實踐項目。
別怕知識不完整。 隨著學(xué)習(xí)進度,你自然會填補空白。
了解每個部分在整體框架中的作用。
第二個錯誤也會導(dǎo)致學(xué)生只見樹木不見森林。 一開始,你完全不需要從零開始編寫每個算法。
雖然說為了學(xué)習(xí)這樣寫一些算法是很好的,但現(xiàn)實是算法正在成為商品。得益于成熟的機器學(xué)習(xí)庫和基于云的解決方案,大多數(shù)從業(yè)人員事實上都不會從零開始編寫算法。
今天,了解如何在合適的情況下(以正確的方式)應(yīng)用正確的算法更為重要。
為了避免這個錯誤:
使用通用機器學(xué)習(xí)庫,如Scikit-Learn(Python)或Caret(R)。
如果你要從零開始編寫一個算法,要明白這樣做是為了學(xué)習(xí)而不是提高應(yīng)用操作。
了解現(xiàn)代機器學(xué)習(xí)算法的發(fā)展前景及其優(yōu)缺點。
有些人進入數(shù)據(jù)科學(xué)這個領(lǐng)域是因為他們想要構(gòu)建未來科技:無人駕駛汽車,高級機器人,計算機視覺等。 這些技術(shù)由深度學(xué)習(xí)和自然語言處理等技術(shù)驅(qū)動。
但是,掌握基本原理很重要。每個奧運跳水運動員都需要先學(xué)習(xí)如何游泳,道理是一樣的。
為了避免這個錯誤:
首先掌握作為高級課題基石的“經(jīng)典”機器學(xué)習(xí)的技術(shù)和算法。
知道經(jīng)典機器學(xué)習(xí)仍然具有巨大的開發(fā)潛力。 雖然算法已經(jīng)成熟,但我們?nèi)匀惶幱陂_發(fā)有成效的應(yīng)用方法的早期階段。
學(xué)習(xí)一種系統(tǒng)的方法來解決任何形式的機器學(xué)習(xí)問題
非專業(yè)人士請勿模仿
申請工作時
以下錯誤都可能導(dǎo)致你在求職過程中錯過一些很好的機會。即使你完全合格,你也可以通過避免這些雷區(qū)來最大限度地發(fā)揮你的優(yōu)勢。
許多申請人在寫簡歷時最大的錯誤是使用過多的技術(shù)術(shù)語。
相反,你的簡歷應(yīng)該把自己描繪清楚,簡歷中的要點應(yīng)該講述一個故事。 你的簡歷應(yīng)該說明你能為組織帶來的影響,特別是如果你申請的是初級職位。
為了避免這個錯誤:
不要簡單地列出你使用的編程語言或編程庫。描述你如何使用它們并解釋結(jié)果。
少即是多。 強調(diào)最重要的技能,可刪除其他內(nèi)容使之更突出。
制作簡歷匯總版本,以便你可以針對不同崗位分離出不同的定制版本。 這保持每個版本干凈。
有時,畢業(yè)生可能高估了他們學(xué)位的價值。 雖然擁有相關(guān)領(lǐng)域強有力的學(xué)位肯定會提高你的機會,但這并不是充分條件,也不是最重要的因素。
這里要說清楚的是,我們并不是說畢業(yè)生們傲慢自大...
在大多數(shù)情況下,學(xué)術(shù)環(huán)境中所教授的與企業(yè)中應(yīng)用的機器學(xué)習(xí)是截然不同的。在企業(yè)中需要權(quán)衡截止期限、客戶和技術(shù)障礙,而這些在學(xué)術(shù)界中并不需要。
為了避免這個錯誤:
通過大量現(xiàn)實世界數(shù)據(jù)項目實踐來輔助課程。
學(xué)習(xí)一種系統(tǒng)的解決機器學(xué)習(xí)問題的方法。
參加相關(guān)實習(xí),即使是兼職。
在領(lǐng)英上約當?shù)氐臄?shù)據(jù)科學(xué)家出來喝咖啡聊聊天。
數(shù)據(jù)科學(xué)是一個相對較新的領(lǐng)域,而且這個組織仍在不斷發(fā)展,以適應(yīng)日益增長的數(shù)據(jù)影響。 如果你只搜索以“數(shù)據(jù)科學(xué)家”開頭的職位,那么你可能漏掉了更多可能。
許多職位沒有被標注為“數(shù)據(jù)科學(xué)”,但是它們可以讓你在類似的崗位發(fā)展相似的技能。
為了避免這個錯誤:
按所需技能進行搜索(機器學(xué)習(xí),數(shù)據(jù)可視化,SQL等)。
按工作職責進行搜索(預(yù)測建模,A / B測試,數(shù)據(jù)分析等)。
按崗位使用的技術(shù)進行搜索(Python,R,Scikit-Learn,Keras等)。
按職位進行搜索(數(shù)據(jù)分析師,量化分析師,機器學(xué)習(xí)工程師等)。
面試期間
最后一類錯誤則是面試中的絆腳石。 你已經(jīng)披荊斬棘走到這一步,所以現(xiàn)在是時候完美收官了。
在回答“你會如何做”這類面試問題時,最保險的做法是用你參與的項目作為例子。 你應(yīng)該用一些具體的例子來說明你是怎么處理某些情況而不是用假設(shè)來闡述。
此外,許多招聘經(jīng)理會要求你有自立的能力,因為數(shù)據(jù)科學(xué)這個角色天然包括項目管理的要素。 這意味著你應(yīng)該了解整個數(shù)據(jù)科學(xué)工作流程,并知道如何將所有內(nèi)容整理在一起。
為了避免這個錯誤:
完成完整的項目,保證你練習(xí)了每一個重要的步驟(即數(shù)據(jù)清理,模型訓(xùn)練等)。
組織你的方法論。數(shù)據(jù)科學(xué)應(yīng)該是反復(fù)論證過的,而不是偶然的。
回顧并且練習(xí)描述你過去在實習(xí),工作或課程中參與的項目。
擁有開發(fā)技術(shù)技能和機器學(xué)習(xí)知識是獲得數(shù)據(jù)科學(xué)職位的基本先決條件。但是,要真正脫穎而出,你應(yīng)該對你申請的具體行業(yè)了解更多。
記住,數(shù)據(jù)科學(xué)從來不存在于虛無中。
為了避免這個錯誤:
如果你要面試一個銀行的職位,請刷一些基本的財務(wù)概念。
如果你要面試一個財富500強企業(yè)的戰(zhàn)略崗位,做一些案例練習(xí)并且學(xué)習(xí)一下企業(yè)利潤的驅(qū)動因素。
如果你要面試一家創(chuàng)業(yè)公司,了解其市場,并嘗試了解如何幫其獲得競爭優(yōu)勢。
簡而言之,一點點額外的努力就可以帶來很大的好處!
目前,在大多數(shù)企業(yè)中,與開發(fā)團隊或分析師團隊相比,數(shù)據(jù)科學(xué)團隊仍然很小。 因此,不同于初級軟件工程師被高級軟件工程師直接管理,數(shù)據(jù)科學(xué)家往往在職能更交叉的崗位中工作。
而且面試官還會期待你具備與不同技術(shù)和數(shù)學(xué)背景的同事溝通的能力。
為了避免這個錯誤:
練習(xí)向非專業(yè)人員解釋技術(shù)概念。 例如,嘗試向朋友解釋你最喜歡的算法。
準備好常見面試問題的回答要點,并練習(xí)表述你的答案。
練習(xí)分析各種數(shù)據(jù)集,提取關(guān)鍵特征并展示你的發(fā)現(xiàn)。
在本指南中,你學(xué)習(xí)了數(shù)據(jù)科學(xué)初學(xué)者最常犯的9個錯誤:
在理論上花太多的時間。
寫了太多從零開始寫的算法。
直接進入深水區(qū),例如,深度學(xué)習(xí)(速度太快了!)。
在簡歷中使用過多的技術(shù)術(shù)語。
高估學(xué)位的價值。
搜索(潛在工作機會的)范圍太狹窄。
對討論的項目毫無準備。
低估知識領(lǐng)域的價值。
忽視溝通技巧。
如果,你正在求職、跳槽、研究,需快速提升實戰(zhàn)技能;
如果,你正在被上述問題困擾不知所措;
如果,你淹沒在海量學(xué)習(xí)資源中找不到明確路徑;
如果,你想快速學(xué)習(xí)且能學(xué)以致用!
你需要實訓(xùn)營助你一臂之力!
掃描海報二維碼,獲取蛻變機會!