本書單是鑒于本人多年浸淫大數(shù)據(jù)領(lǐng)域的經(jīng)驗(yàn),按照學(xué)習(xí)大數(shù)據(jù)的階段和技術(shù)所列的書單,適合剛剛接觸大數(shù)據(jù)領(lǐng)域的新人。
話不多說(shuō),直接上書單!
推薦書籍:
本書為我們帶來(lái)了共78條程序員必備的經(jīng)驗(yàn)法則,針對(duì)你每天都會(huì)遇到的編程問(wèn)題提出了有效、實(shí)用的解決方案。 書中的每一章都包含幾個(gè)'條目',以簡(jiǎn)潔的形式呈現(xiàn),自成獨(dú)立的短文,它們提出了具體的建議,對(duì)于Java平臺(tái)精妙之處的獨(dú)到見(jiàn)解,以及優(yōu)秀的代碼范例。每個(gè)條目的綜合描述和解釋都闡明了應(yīng)該怎么做,不應(yīng)該怎么做,以及為什么。
Linux體系、Hadoop離線計(jì)算大綱、分布式數(shù)據(jù)庫(kù)Hbase、數(shù)據(jù)倉(cāng)庫(kù)Hive、數(shù)據(jù)遷移工具Sqoop、Flume分布式日志框架
推薦書籍:
在大數(shù)據(jù)的背景下,我很少看到關(guān)于數(shù)據(jù)建模,數(shù)據(jù)層,數(shù)據(jù)處理需求分析以及數(shù)據(jù)架構(gòu)和存儲(chǔ)實(shí)現(xiàn)問(wèn)題。這本書卻提供了令人耳目一新的全面解決方案。
《Hadoop權(quán)威指南(中文版)》從Hadoop的緣起開(kāi)始,由淺入深,結(jié)合理論和實(shí)踐,全方位地介紹Hadoop這一高性能處理海量數(shù)據(jù)集的理想工具。
《Hive編程指南》是一本Apache Hive的編程指南,旨在介紹如何使用Hive的SQL方法HiveQL來(lái)匯總、查詢和分析存儲(chǔ)在Hadoop分布式文件系統(tǒng)上的大數(shù)據(jù)集合。
推薦書籍:
《Spark 快速大數(shù)據(jù)分析》是一本為Spark 初學(xué)者準(zhǔn)備的書,它沒(méi)有過(guò)多深入實(shí)現(xiàn)細(xì)節(jié),而是更多關(guān)注上層用戶的具體用法。不過(guò),本書絕不僅僅限于Spark 的用法,它對(duì)Spark 的核心概念和基本原理也有較為全面的介紹,讓讀者能夠知其然且知其所以然。
本書采用理論與大量實(shí)例相結(jié)合的方式幫助開(kāi)發(fā)人員掌握使用Spark進(jìn)行分析和實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法。通過(guò)這些示例和Spark在各種企業(yè)級(jí)系統(tǒng)中的應(yīng)用,幫助讀者解鎖Spark機(jī)器學(xué)習(xí)算法的復(fù)雜性,通過(guò)數(shù)據(jù)分析產(chǎn)生有價(jià)值的數(shù)據(jù)洞察力。
數(shù)據(jù)獲取、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)、數(shù)據(jù)應(yīng)用
推薦書籍:
數(shù)據(jù)分析經(jīng)典入門。通俗簡(jiǎn)單,看這本書雖學(xué)不到什么數(shù)據(jù)分析的技能點(diǎn),卻能夠讓你對(duì)數(shù)據(jù)分析的相關(guān)概念有大致的了解。有利于你構(gòu)建數(shù)據(jù)思維的基石,嘗試跟著作者的思維邏輯去思考、感悟,記住其中提到的一些數(shù)據(jù)分析原則。
結(jié)合生活講解統(tǒng)計(jì)知識(shí),生動(dòng)有趣。作者從自身出發(fā),講述自己從一個(gè)只知道學(xué)習(xí)的學(xué)霸,開(kāi)始發(fā)現(xiàn)統(tǒng)計(jì)學(xué)的樂(lè)趣,并將其運(yùn)用到生活中的故事。因此避免了統(tǒng)計(jì)學(xué)一上來(lái)就是各種暈頭暈?zāi)X的專業(yè)概念的枯燥感。
這本書舉例了多種產(chǎn)品,分析了它們的指標(biāo)、模型。同時(shí)將企業(yè)分成了幾個(gè)大的行業(yè)類別,并分門別類的講解了每個(gè)行業(yè)的商業(yè)模式特點(diǎn)及分析技巧。
ps. 對(duì)使用者的分析能力要求較高,且必須具備相應(yīng)的業(yè)務(wù)知識(shí)。
主要是講解Data Analyze數(shù)據(jù)分析基礎(chǔ)、數(shù)據(jù)可視化、sklearn中三類樸素貝葉斯算法以及python機(jī)器學(xué)習(xí)等提升個(gè)人能力的內(nèi)容!
推薦書籍:
如果要用R語(yǔ)言做數(shù)據(jù)分析,建議讀完《深入淺出數(shù)據(jù)分析》之后,就開(kāi)始讀這本。從工具的安裝,到具體分析方法在R語(yǔ)言中的實(shí)現(xiàn),講解詳細(xì),可操作性極強(qiáng),是一本非常值得讀的數(shù)據(jù)分析書。
這本書被業(yè)內(nèi)譽(yù)為是“數(shù)據(jù)分析和機(jī)器學(xué)習(xí)之間的橋梁”。
網(wǎng)評(píng):對(duì)于做了一段時(shí)間數(shù)據(jù)分析工作的人,這無(wú)疑是進(jìn)階更高維度的好書,很難有一本書,能夠讓你從簡(jiǎn)單的數(shù)據(jù)分析平滑地過(guò)渡到機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘,這本書我認(rèn)為是這方面做的最好的一本。
國(guó)內(nèi)第一本數(shù)據(jù)可視化教材,如果你學(xué)習(xí)可視化是剛需,看這本。
是數(shù)據(jù)可視化的入門書籍,系統(tǒng)介紹了可視化的相關(guān)概念和常識(shí),教材相對(duì)于工具書更為難讀,但卻能為你增長(zhǎng)不少對(duì)可視化的認(rèn)知。
聯(lián)系客服