時(shí)間和成本是人們在嘗試學(xué)習(xí)數(shù)據(jù)科學(xué),人工智能或機(jī)器學(xué)習(xí)時(shí)面臨的重大阻礙。自學(xué)是一門需要自律和付出才能掌握的藝術(shù)。如果處理得當(dāng),你能靈活地將學(xué)習(xí)與工作相結(jié)合。然而,人工智能或機(jī)器學(xué)習(xí)的開始階段非常艱難,但是請相信我這樣的擔(dān)心是值得的。自學(xué)時(shí)取得良好進(jìn)展的關(guān)鍵是按照自己的節(jié)奏學(xué)習(xí)。在這篇文章中,我將分享一個(gè)期望學(xué)習(xí)數(shù)據(jù)科學(xué),人工智能和機(jī)器學(xué)習(xí),以及在學(xué)習(xí)其他新事物方面取得良好的進(jìn)步的人可以遵循的道路。我還將分享我個(gè)人使用的資源鏈接,并毫無疑問地推薦這些材料。雖然聽起來很煩人,但是在這個(gè)領(lǐng)域中數(shù)學(xué)非常重要。我可以肯定地說,任何閱讀這篇文章的人都具有高中數(shù)學(xué)的一些基礎(chǔ)知識(shí)或中級(jí)知識(shí)。這是一個(gè)好的開始,但在數(shù)據(jù)科學(xué),人工智能和機(jī)器學(xué)習(xí)領(lǐng)域,這些還遠(yuǎn)遠(yuǎn)不夠。你需要進(jìn)一步深入研究,并學(xué)習(xí)一些統(tǒng)計(jì),代數(shù)和其他領(lǐng)域的概念。我會(huì)整理一個(gè)主題和資源列表,以幫助你學(xué)習(xí)數(shù)據(jù)科學(xué)中的數(shù)學(xué),但是Ibrahim Sharaf ElDen在這篇文章中已經(jīng)完美地做到了。https://towardsdatascience.com/mathematics-for-data-science-e53939ee8306?gi=e0a64546b594
作為初學(xué)者,不要直接開始學(xué)習(xí)編寫用于機(jī)器學(xué)習(xí)的代碼,而應(yīng)該先學(xué)一般的編程核心概念。了解編程的全部內(nèi)容,了解現(xiàn)有代碼的類型以及如何正確編寫代碼。這一點(diǎn)非常重要,因?yàn)槟銓⒃趶氖略擃I(lǐng)域的其余時(shí)光中受用于這些基本概念?;c(diǎn)時(shí)間在這步當(dāng)中,而不要急于學(xué)習(xí)高級(jí)的東西,了解此步驟中的大多數(shù)內(nèi)容將決定你在行業(yè)中的表現(xiàn)。你可以在在里找到非常好的介紹編程和計(jì)算機(jī)科學(xué)的視頻。這個(gè)視頻將帶你全面了解編程和計(jì)算機(jī)科學(xué)的所有重要概念?;c(diǎn)時(shí)間,并確保你了解當(dāng)中的每一點(diǎn)。https://www.youtube.com/watch?v=zOjov-2OZ0E如今,數(shù)據(jù)科學(xué)家,人工智能和機(jī)器學(xué)習(xí)工程師使用多種語言來完成工作,其中最常用的語言是Python,R,Java,Julia和SQL。也可以使用許多其他語言,但出于多種原因,我列出的語言是最常用的語言:如果你有足夠的學(xué)習(xí)時(shí)間并能堅(jiān)持,那么它們很容易學(xué)會(huì)并且可以快速用于開發(fā);
它們使你可以用更少的代碼做更多的事情;
它們有一個(gè)良好而穩(wěn)固的技術(shù)社區(qū),可以在遇到任何問題時(shí)為你提供幫助和支持;
他們擁有你作為數(shù)據(jù)科學(xué)家,人工智能或機(jī)器學(xué)習(xí)工程師所需的幾乎所有庫和軟件包;
它們是開源的,可以免費(fèi)使用。
學(xué)習(xí)一種以上的語言絕對(duì)是沒有錯(cuò)的,事實(shí)上,了解一種以上的語言是有好處的。但你必須花時(shí)間,并避免同時(shí)學(xué)習(xí)多種語言,因?yàn)檫@可能會(huì)使你感到困惑,并使你暫時(shí)迷失方向?;〞r(shí)間,一次學(xué)習(xí)一種語言,并確保僅學(xué)習(xí)職業(yè)所需的部分。我建議你先學(xué)習(xí)Python,因?yàn)樗且环N相對(duì)容易理解的語言。我還建議你在學(xué)習(xí)用于數(shù)據(jù)科學(xué)和人工智能 / 機(jī)器學(xué)習(xí)的Python之前先學(xué)習(xí)一般的Python。https://www.youtube.com/watch?v=r-uOLxNrNk8https://www.youtube.com/watch?v=rfscVS0vtbw&t=5s數(shù)據(jù)不是天上掉下來的,有時(shí)根本沒有數(shù)據(jù)供你使用,但是無論如何,你都必須找到一種獲取可以使用的數(shù)據(jù)的方法。與你合作的組織可能有一個(gè)很好的數(shù)據(jù)收集系統(tǒng),如果有的話,那么這對(duì)你來說是一個(gè)加分。否則,你必須找到一種獲取數(shù)據(jù)的方法,不僅可以獲取任何數(shù)據(jù),還能獲取可以用來實(shí)現(xiàn)目標(biāo)的高質(zhì)量數(shù)據(jù)。獲取數(shù)據(jù)并不直接意味著挖掘數(shù)據(jù),它是數(shù)據(jù)挖掘下的一個(gè)過程。你可以在互聯(lián)網(wǎng)上的許多地方獲得免費(fèi)和開源的數(shù)據(jù),有時(shí)你可能不得不從網(wǎng)站上抓取數(shù)據(jù)。網(wǎng)絡(luò)抓取非常重要,我懇請每個(gè)人都學(xué)習(xí)它,因?yàn)樵谀阕鳛閿?shù)據(jù)科學(xué)家,人工智能或機(jī)器學(xué)習(xí)工程師的職業(yè)生涯中可能會(huì)需要它。這是有關(guān)網(wǎng)絡(luò)抓取的好教程。https://www.youtube.com/watch?v=0_VZ7NpVw1Y數(shù)據(jù)也可能保存在數(shù)據(jù)庫中,因此作為數(shù)據(jù)科學(xué)家,人工智能或機(jī)器學(xué)習(xí)工程師,你必須了解一些數(shù)據(jù)庫管理知識(shí),以便能夠連接到數(shù)據(jù)庫并直接進(jìn)行工作。在此階段,SQL知識(shí)非常重要。你可以在此處學(xué)習(xí)相關(guān)知識(shí)。https://www.youtube.com/watch?v=sTiWTx0ifaM&t=15s學(xué)會(huì)做數(shù)據(jù)處理
這通常稱為數(shù)據(jù)整理。此過程涉及清洗你擁有的數(shù)據(jù),這可以通過對(duì)你擁有的數(shù)據(jù)執(zhí)行一些探索性數(shù)據(jù)分析并刪除數(shù)據(jù)中不需要的部分來完成。該過程還涉及將你擁有的數(shù)據(jù)構(gòu)造為可以使用的形式。這個(gè)階段是從事數(shù)據(jù)科學(xué),人工智能或機(jī)器學(xué)習(xí)項(xiàng)目中最疲憊的部分。在學(xué)習(xí)過程中,你使用的大多數(shù)示例數(shù)據(jù)都已經(jīng)做過預(yù)處理,但是現(xiàn)實(shí)世界中的數(shù)據(jù)可能沒有經(jīng)過任何處理階段。作為一個(gè)渴望在此領(lǐng)域做得很好的人,你應(yīng)該找到一些現(xiàn)實(shí)世界的數(shù)據(jù)并加以處理。雖然在幾乎任何地方都能找到真實(shí)世界的數(shù)據(jù),但Kaggle是全球公司獲取真實(shí)世界數(shù)據(jù)的絕佳場所。數(shù)據(jù)整理或處理是一項(xiàng)非常艱巨的任務(wù),但如果你具備始終如一的奉獻(xiàn)精神和堅(jiān)持力,這對(duì)你而言就可能是一件非常有趣的事情了。你可以在此處找到劍橋的教授關(guān)于數(shù)據(jù)整理的精彩演講:https://www.youtube.com/watch?v=sz_dsktIjt4學(xué)會(huì)數(shù)據(jù)可視化
作為數(shù)據(jù)科學(xué)家,人工智能或機(jī)器學(xué)習(xí)工程師,也不一定意味著你所在的公司或團(tuán)隊(duì)中的每個(gè)人都將能夠理解你所在領(lǐng)域的技術(shù)或原始格式的數(shù)據(jù)。這就是為什么需要學(xué)習(xí)數(shù)據(jù)可視化。數(shù)據(jù)可視化基本上是指以圖形形式顯示數(shù)據(jù)的過程,以便使任何人,無論他們具不具備相關(guān)背景,都可以理解數(shù)據(jù)的含義。有許多種可視化數(shù)據(jù)的方法。作為程序員,編寫代碼來進(jìn)行數(shù)據(jù)可視化應(yīng)該是我們的首選方法,因?yàn)檫@是快速且無成本的。可以使用所用的編程語言附帶的開源庫來編寫代碼進(jìn)行數(shù)據(jù)可視化。Matplotlib,Seaborn和Bokeh都是我們可以用來可視化數(shù)據(jù)的Python庫。你可以在此處找到有關(guān)使用Matplotlib進(jìn)行數(shù)據(jù)可視化的視頻教程:https://www.youtube.com/watch?v=yZTBMMdPOww
可視化數(shù)據(jù)的另一種方法是使用諸如Tableau之類的閉源工具,它們可用于進(jìn)行更優(yōu)雅和復(fù)雜的可視化,但它是付費(fèi)的。Tableau是最常見的工具,它是我個(gè)人經(jīng)常使用的工具。我會(huì)建議所有人學(xué)習(xí)使用Tableau。你可以在此處找到有關(guān)使用Tableau的很好的教程:https://www.youtube.com/watch?v=aHaOIvR00So
人工智能和機(jī)器學(xué)習(xí)更像是數(shù)據(jù)科學(xué)的子集,因?yàn)樗鼈円彩怯蓴?shù)據(jù)驅(qū)動(dòng)的。它們指的是訓(xùn)練機(jī)器或其他無生命物體所涉及的過程,即通過向它們提供經(jīng)過良好處理的數(shù)據(jù)來使其表現(xiàn)得像人。通過逐步指導(dǎo)機(jī)器,就可以教機(jī)器去做人類可以做的許多事情。在這種情況下,可以將機(jī)器想象為完全沒有知識(shí),但逐漸學(xué)會(huì)識(shí)別物體,說話,從錯(cuò)誤中學(xué)習(xí)并變得更好的嬰兒。我們也可以用相同的方式教機(jī)器來完成這些事情中的大多數(shù)。人工智能和機(jī)器學(xué)習(xí)基本上是通過使用許多數(shù)學(xué)算法來賦予機(jī)器生命的過程。人工智能和機(jī)器學(xué)習(xí)的全部潛力仍然未知,因?yàn)樗€是在不斷進(jìn)步的領(lǐng)域之一。但是目前,人工智能和機(jī)器學(xué)習(xí)已廣泛用于認(rèn)知任務(wù),例如對(duì)象檢測和識(shí)別,面部識(shí)別,語音識(shí)別和自然語言處理,欺詐和垃圾郵件檢測等。我將繼續(xù)深入探討人工智能和機(jī)器學(xué)習(xí),但現(xiàn)在,我希望你在這里了解人工智能和機(jī)器學(xué)習(xí)的一般應(yīng)用:https://www.youtube.com/watch?v=5hNK7-N23eU從這個(gè)視頻資源中深入學(xué)習(xí)機(jī)器學(xué)習(xí):https://www.youtube.com/watch?v=GwIo3gDZCVQ&t=5s
在這些視頻的結(jié)尾,你應(yīng)該已經(jīng)學(xué)習(xí)了有關(guān)機(jī)器學(xué)習(xí)的初學(xué)者和中級(jí)知識(shí),了解了許多可用的機(jī)器學(xué)習(xí)算法,它們的作用以及如何使用它們。現(xiàn)在,你應(yīng)該已經(jīng)準(zhǔn)備好構(gòu)建第一個(gè)簡單的機(jī)器學(xué)習(xí)模型了。你可以在Victor Roman的這篇文章的幫助下進(jìn)行操作:https://towardsdatascience.com/machine-learning-general-process-8f1b510bd8af學(xué)會(huì)讓在網(wǎng)絡(luò)上部署你的機(jī)器學(xué)習(xí)模型
通過部署你用機(jī)器學(xué)習(xí)構(gòu)建的模型,你就可以將其提供給網(wǎng)絡(luò)上的每個(gè)人。為此,需要對(duì)Web開發(fā)有很好的了解,因?yàn)槟阈枰獎(jiǎng)?chuàng)建一個(gè)網(wǎng)頁或一組網(wǎng)頁來容納模型。你網(wǎng)站的前端還需要與包含模型的后端進(jìn)行通信。為此,你還需要知道如何構(gòu)建和集成API,以處理這些通信。如果你打算通過管道或Docker容器在云服務(wù)器上部署機(jī)器學(xué)習(xí)模型,則可能需要對(duì)云計(jì)算和DevOP有很好的了解。部署機(jī)器學(xué)習(xí)模型的方法有很多,但首先,我建議你學(xué)習(xí)如何使用Python網(wǎng)絡(luò)框架Flask部署機(jī)器學(xué)習(xí)模型。https://www.youtube.com/watch?v=UbCWoMf80PY自學(xué)是驚人的,但是沒有什么比直接向行內(nèi)專業(yè)人士請教更好。這是因?yàn)槟憧梢詫W(xué)到具有實(shí)際意義的概念和其他只有實(shí)踐經(jīng)驗(yàn)才能學(xué)到的東西。擁有一名導(dǎo)師有很多好處,但并不是每個(gè)導(dǎo)師都能對(duì)你的職業(yè)生涯或整個(gè)人生產(chǎn)生影響。這就是為什么擁有一個(gè)良好的導(dǎo)師很重要。Notitia AI是一個(gè)很好的平臺(tái):可以在數(shù)據(jù)科學(xué),人工智能和機(jī)器學(xué)習(xí)方面從初學(xué)者到專家水平進(jìn)行培訓(xùn),在該平臺(tái)上,你將被指派一名私人導(dǎo)師,他將親自和專業(yè)地協(xié)助你在所選領(lǐng)域的發(fā)展。它也是你能找到的的最實(shí)惠的網(wǎng)課培訓(xùn)和指導(dǎo)平臺(tái)。但請注意,僅參加課程并從在線資源中學(xué)習(xí)不會(huì)使你成為數(shù)據(jù)科學(xué)家,人工智能或機(jī)器學(xué)習(xí)工程師。你必須獲得在這些領(lǐng)域提供認(rèn)證的機(jī)構(gòu)的證書,并且某些工作職位還需要你具有一定的學(xué)歷?;ㄐr(shí)間學(xué)習(xí),獲得認(rèn)證或?qū)W位,你將準(zhǔn)備好上岸。https://towardsdatascience.com/the-self-learning-path-to-becoming-a-data-scientist-ai-or-ml-engineer-9ab3a97ca63518個(gè)行業(yè),106個(gè)中國大數(shù)據(jù)應(yīng)用最佳實(shí)踐案例:
(1)《贏在大數(shù)據(jù):中國大數(shù)據(jù)發(fā)展藍(lán)皮書》;
免費(fèi)試讀:https://item.jd.com/12058569.html
(2)《贏在大數(shù)據(jù):金融/電信/媒體/醫(yī)療/旅游/數(shù)據(jù)市場行業(yè)大數(shù)據(jù)應(yīng)用典型案例》;
免費(fèi)試讀:https://item.jd.com/12160046.html
(3)《贏在大數(shù)據(jù):營銷/房地產(chǎn)/汽車/交通/體育/環(huán)境行業(yè)大數(shù)據(jù)應(yīng)用典型案例》;
免費(fèi)試讀:https://item.jd.com/12160064.html
(4)《贏在大數(shù)據(jù):政府/工業(yè)/農(nóng)業(yè)/安全/教育/人才行業(yè)大數(shù)據(jù)應(yīng)用典型案例》。
免費(fèi)試讀:https://item.jd.com/12058567.html
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點(diǎn)擊舉報(bào)。