這些書的看書周期大概有一年半吧
一年半前決定轉(zhuǎn)行數(shù)據(jù)科學(xué)
之前寫過一篇:
回顧與展望轉(zhuǎn)行數(shù)據(jù)科學(xué)路上的點(diǎn)點(diǎn)滴滴(2016-2018)
深知轉(zhuǎn)行學(xué)習(xí)的痛苦,入門踩過很多坑,所以寫了Python入門連載,還錄制了免費(fèi)視頻,有興趣學(xué)習(xí)的朋友可以看看哈:
https://edu.hellobi.com/course/234
當(dāng)然轉(zhuǎn)行不能只是說說而已,還是要下功夫的,于是買了很多書,也被送了很多書,下面談?wù)勎疫@一年半看過的相關(guān)的書:
SQL學(xué)習(xí)指南
個(gè)人推薦指數(shù):★ ★ ★
SQL是學(xué)數(shù)據(jù)分析挖掘必須會(huì)的,這本書因?yàn)橹百I的,就看的這個(gè),個(gè)人感覺,初學(xué)者會(huì)在多表連接和查詢那里糾結(jié)很久,當(dāng)然,我SQL學(xué)的并不是很好,還需多多加強(qiáng),可惜的一點(diǎn)是,這本書的數(shù)據(jù)好像并沒有提供,所以我沒辦法實(shí)操一下。
Python基礎(chǔ)教程
個(gè)人推薦指數(shù):★
書的內(nèi)容是用Python2寫的,不太適合初學(xué)者學(xué)習(xí),因?yàn)镻ython2不久將不在維護(hù),還是學(xué)Python3好,在京東等商城銷量很高,但是不建議作為入門書籍,因?yàn)榈诹戮烷_始寫到參數(shù)魔法,新手會(huì)很難理解,入門書應(yīng)當(dāng)是生動(dòng)有趣易理解的,這也是我寫Python從零開始入門連載的原因之一。
聽說已經(jīng)出的第三版是Python3寫的
像計(jì)算機(jī)科學(xué)家一樣思考Python
個(gè)人推薦指數(shù):★
這本書銷量很高,看的時(shí)候印象最深的就是遞歸的思想,如果你已經(jīng)看過我的Python入門基礎(chǔ)課,可以不看這本,這本書相對(duì)多出來的知識(shí)點(diǎn)問我在Python進(jìn)階文章前幾篇已經(jīng)寫出來了。這本書不適合作為入門書,原因是每個(gè)點(diǎn)講的不全面。
Head First Python
個(gè)人推薦指數(shù):★ ★ ★ ★
這本書是我最開始接觸Python看的幾本書之一,書中大量插畫,使用Python解決一些實(shí)際問題,初學(xué)者可以不按照本書內(nèi)容敲代碼,看懂即可,因?yàn)楸緯a量太大,可能讓初學(xué)者從入門到放棄。
Python程序設(shè)計(jì)基礎(chǔ)
個(gè)人推薦指數(shù):★ ★ ★
這本書推薦給喜歡應(yīng)試教育的朋友,作為入門書也是很合適的,基于Python3寫的,再說Python已經(jīng)加入全國(guó)計(jì)算機(jī)二級(jí)考試,這本書作為教材也是很OK的。
流暢的Python
個(gè)人推薦指數(shù):★ ★ ★ ★
這本書是奉獻(xiàn)給那些想將Python寫的更優(yōu)雅的朋友,深度剖析Python的深層內(nèi)容,細(xì)細(xì)品讀,每章都有極大收獲,當(dāng)然,書很厚,我還沒看完。
精通Python網(wǎng)絡(luò)爬蟲
個(gè)人推薦指數(shù):★ ★ ★
我學(xué)網(wǎng)絡(luò)爬蟲是看的韋瑋老師視頻,通俗易懂,很棒!之后韋瑋老師這本書出版之后,就看了一遍,書中對(duì)網(wǎng)絡(luò)爬蟲原理,urllib庫(kù),正則表達(dá)式,scrapy講得比較透徹,推薦大家額外看看BeautifulSoup,xpath等給力解析庫(kù),本書使用Fiddler抓包分析,但我更推薦谷歌瀏覽器的開發(fā)者模式。
深入淺出數(shù)據(jù)分析
個(gè)人推薦指數(shù):★ ★ ★ ★
這本書適合作為學(xué)數(shù)據(jù)分析的入門書,書中大量插圖,生動(dòng)形象,深入淺出,每章都是為了解決特定問題而反復(fù)思考迭代。
白話大數(shù)據(jù)與機(jī)器學(xué)習(xí)
個(gè)人推薦指數(shù):★ ★ ★ ★
推薦這本書入門機(jī)器學(xué)習(xí),不要糾結(jié)書中的代碼,看每種機(jī)器學(xué)習(xí)的舉例介紹,通俗易懂,書中很多漫畫插圖,算法原理推導(dǎo)基本不深,特別是隱馬爾可夫部分講的很棒,作為入門機(jī)器學(xué)習(xí)的書非常棒!
機(jī)器學(xué)習(xí)
個(gè)人推薦指數(shù):★ ★ ★ ★ ★
周志華老師的機(jī)器學(xué)習(xí),應(yīng)當(dāng)算是國(guó)內(nèi)機(jī)器學(xué)習(xí)書籍銷量最高了吧,除去國(guó)外書籍,這是你學(xué)機(jī)器學(xué)習(xí)必看的經(jīng)典書籍(因?yàn)槲宜私獾膰?guó)外有好幾本經(jīng)典的機(jī)器學(xué)習(xí)書籍)。這本書從西瓜數(shù)據(jù)開始,到西瓜數(shù)據(jù)結(jié)束,每個(gè)算法點(diǎn)到即止(不代表深度不夠,這里指的是篇幅上不廢話)。對(duì)我?guī)椭畲蟮氖潜緯诙碌哪P驮u(píng)估選擇,講的非常成體系。當(dāng)然,書上的理論推導(dǎo)很難,有興趣可以看看一些學(xué)習(xí)筆記。
機(jī)器學(xué)習(xí)基礎(chǔ)教程
個(gè)人推薦指數(shù):★ ★
這本書是理論書,從線性回歸開始,將最小二乘法和極大似然法實(shí)現(xiàn)全都詳細(xì)推導(dǎo)一遍,酣暢淋漓,之后的貝葉斯方法和貝葉斯推理,理論性太強(qiáng),看的讓人想撕書,不過通俗易懂,再之后的分類聚類降維寫的沒什么特色。數(shù)學(xué)好的同學(xué)可以挑戰(zhàn)看看。
集體智慧編程
個(gè)人推薦指數(shù):★ ★
這本書Python代碼是2版本,書比較老(經(jīng)典)了,這本書我看了一部分就放棄了,原因是書中的數(shù)據(jù)提供的網(wǎng)站很多都失效了,不過這本書的思想還是不錯(cuò)的,以后還會(huì)回來看看的。
機(jī)器學(xué)習(xí)實(shí)戰(zhàn)
個(gè)人推薦指數(shù):★ ★ ★ ★ ★
這本書非常給力,基本不用sklearn等別人造好的輪子,基本都是自己定義函數(shù)實(shí)現(xiàn)功能,對(duì)你從底層了解機(jī)器學(xué)習(xí)代碼實(shí)現(xiàn)非常有幫助,注釋不夠多,你可能不明白某段代碼的含義,你可以使用print函數(shù)輸出看看,然后加以理解,遇到?jīng)]見過的方法,可以百度它的作用,因?yàn)闀容^老,所以有些方法已經(jīng)改動(dòng)過或者不用,你百度最新替代的方法試試。
Python機(jī)器學(xué)習(xí)及實(shí)踐
個(gè)人推薦指數(shù):★ ★ ★
整本書180頁(yè),不到兩天就能擼完,書中提供的代碼是Python2,自己稍作修改改成3運(yùn)行一遍,有Python基礎(chǔ)就跳過第一章,第二章將常見機(jī)器學(xué)習(xí)算法的實(shí)現(xiàn),主要有用的是sklearn,通過看完這章,你就知道了用sklearn做機(jī)器學(xué)習(xí)的步驟:導(dǎo)入數(shù)據(jù),數(shù)據(jù)預(yù)處理,訓(xùn)練數(shù)據(jù)訓(xùn)練模型,測(cè)試數(shù)據(jù)預(yù)測(cè),模型性能評(píng)估。第三章是本書兩點(diǎn),講到了特征提升、模型正則化、模型檢驗(yàn)、超參數(shù)搜索優(yōu)化。本書在模型的欠擬合和過擬合部分闡述的很好,之后講到了一些流行的庫(kù),包括NLTK、Word2Vec、XGBoost、Tensorflow,涉及自然語(yǔ)言處理,深度學(xué)習(xí)。全本書原理一筆帶過,最后一章講到鼓勵(lì)參加Kaggle比賽,并拿出了三個(gè)案例講解。本書適合學(xué)完sklearn基礎(chǔ)的朋友想用sklearn實(shí)現(xiàn)完整機(jī)器學(xué)習(xí)項(xiàng)目,缺點(diǎn)是書中模型基本使用的都是默認(rèn)參數(shù)。
統(tǒng)計(jì)學(xué)習(xí)方法
個(gè)人推薦指數(shù):★ ★ ★ ★ ★
想學(xué)數(shù)據(jù)挖掘或者機(jī)器學(xué)習(xí)不可避免要接觸數(shù)學(xué)相關(guān)理論,盡管你可以只用sklearn等做機(jī)器學(xué)習(xí),但不懂底層理論,是無法做深入的,而這本書,就是給你打好機(jī)器學(xué)習(xí)基礎(chǔ)的書,先修內(nèi)容大學(xué)數(shù)學(xué)三件套(高等數(shù)學(xué)、線性代數(shù)、概率論與數(shù)理統(tǒng)計(jì)),如果你不是數(shù)學(xué)基礎(chǔ)特別好,看這本書的時(shí)候會(huì)像我一樣看不懂一些公式推導(dǎo),莫慌,百度一下別人的學(xué)習(xí)筆記或者技術(shù)博客,慢慢鉆研,本書適合看多次,每次都有新的收獲,書本身不厚,230頁(yè),建議邊看邊將感悟推導(dǎo)公司等寫在旁邊,方便下次看。
數(shù)據(jù)挖掘?qū)д?/strong>
個(gè)人推薦指數(shù):★ ★ ★
說是導(dǎo)論,大家不要以為他很簡(jiǎn)單就能看懂,還是有難度的,第一章簡(jiǎn)介,第二章詳談了數(shù)據(jù)這一概念,你會(huì)接觸很多沒聽過的專業(yè)術(shù)語(yǔ),分類算法講的不多,SVM中對(duì)核函數(shù)的引入講解的特別傳神,本書花了大量筆墨在關(guān)聯(lián)分析和聚類分析,這兩處挖得很深,本書最后講到異常檢測(cè),書中全是理論,沒講代碼實(shí)現(xiàn)。
大話數(shù)據(jù)結(jié)構(gòu)
個(gè)人推薦指數(shù):★ ★ ★ ★
如果你還是在校學(xué)生,并且想通過校招找一份數(shù)據(jù)分析挖掘或者機(jī)器學(xué)習(xí)崗位,那必然會(huì)面對(duì)數(shù)據(jù)結(jié)構(gòu)算法問題,如果你和我一樣非科班出身,剛接觸數(shù)據(jù)結(jié)構(gòu)算法一定會(huì)很懵逼,那我推薦你這本書,書中大量插畫,幫助理解,上課式情景教學(xué),非常棒,幫你打開數(shù)據(jù)結(jié)構(gòu)算法大門,讓你破門而入!
聯(lián)系客服