国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
盤點:為 Java 開發(fā)者量身定制的五款機器學習庫

編者按:機器學習是目前最炙手可熱的技術之一,各大公司都在積極招聘相關的編程人才,來填補機器學習和深度學習代碼編寫的空缺。誠然,根據(jù)相關的招聘統(tǒng)計數(shù)據(jù),Python 語言目前已經(jīng)超越 Java 成為雇主最亟須的機器學習編程技能。但事實上,Java 在項目開發(fā)中仍然發(fā)揮著不可替代的作用,并且許多流行的機器學習框架本身就是由 Java 寫成的。鑒于此前有關 Python 的參考資料已經(jīng)很多,而鮮見 Java 的,因此,今天我們在這里推薦五個業(yè)內頂尖的 Java 機器學習庫。原文載于網(wǎng)站,雷鋒網(wǎng)()編譯。

毫無疑問,Weka 是目前首選的 Java 機器學習庫。

它由新西蘭懷卡托大學(University of Waikato)的機器學習項目組研發(fā)。其命名來源于一種新西蘭特有的不會飛的鳥——新西蘭秧雞,新西蘭秧雞的英文名稱就是 Weka。按照官網(wǎng)描述,Weka 吸收了許多目前常用的機器學習算法,并且完全基于 Java 環(huán)境,開源,免費,具有易于使用的圖形界面,適合于數(shù)據(jù)挖掘,數(shù)據(jù)分析和預測建模等多種應用場景。

來自懷卡托大學的計算機科學教授 Eibe Frank 表示:“Weka 最大的優(yōu)勢在于分類,因此需要自動數(shù)據(jù)分類的應用程序可以從中獲益但同時它也支持數(shù)據(jù)預處理、聚類、關聯(lián)規(guī)則挖掘、時間序列預測、特征選擇、和異常檢測等場景?!?/p>

開發(fā)者可以直接通過 Weka 軟件處理目標數(shù)據(jù)集,同時也支持用戶在自己編寫的代碼中調用,將 Weka 視為一個靈活的組件。更貼心的是,懷卡托大學還提供了許多免費的基于 Weka 的數(shù)據(jù)挖掘和機器學習視頻教程,感興趣的朋友可以在 Weka 官網(wǎng)點擊查看。

Massive Online Analysis (MOA)

和 Weka 一脈相承,MOA 的命名也是來源于一種新西蘭特有的無翼大鳥——新西蘭恐鳥(目前已滅絕)。MOA 也是基于 Java 環(huán)境,開源,免費,在面對復雜問題時,MOA 還能和 Weka 協(xié)同工作。

MOA 在運算效率和內存占用方面都做了特殊優(yōu)化,通過提供易于擴展的底層結構、可復用的數(shù)據(jù)流分析設置以及一系列內部實現(xiàn)好機器學習算法,MOA 為實時數(shù)據(jù)流分析提供了一個非常優(yōu)秀的基準框架,因此在實時數(shù)據(jù)流挖掘領域的應用非常廣泛。其內部實現(xiàn)的機器學習算法包括:分類、回歸、聚類、孤立點檢測、概念漂移檢測和推薦系統(tǒng)等。此外,MOA 還提供了多種評估工具,以及活躍的社區(qū)討論、博客等配套資源。

Deeplearning4j

地址:

Deeplearning4j(Deep Learning For Java)是 Java 和 Scala 環(huán)境下的一個開源分布式的深度學習項目,由總部位于美國舊金山的商業(yè)智能和企業(yè)軟件公司 Skymind 牽頭開發(fā),并得到了騰訊的投資。正如它的命名,Deeplearning4j 的運行需要 Java 虛擬機 JVM 的支持。

去年,JAXenter 社區(qū)曾提名 Deeplearning4j 作為 Java 生態(tài)系統(tǒng)最具創(chuàng)新的貢獻者之一。

Deeplearning4j 旨在為工作在 Hadoop 框架下的 Java、ScalaClojure 程序員提供一個可以靈活 DIY 的機器學習工具。團隊在官網(wǎng)表示,他們希望通過一些機器學習算法的開發(fā),將商業(yè)帶入智能化數(shù)據(jù)的時代。也正是為了實現(xiàn)這一理想,惠及更多的用戶,因此選擇了移植性更好的 Java 環(huán)境來實現(xiàn)這些算法。目前,Deeplearning4j 在模式識別、時間序列檢測和基于語音、文本的情感識別方面應用廣泛,包括谷歌、Facebook微軟等巨頭公司都是它的用戶。

MALLET主要由來自麻省大學(University of Massachusetts)的Andrew McCallum教授和其學生開發(fā),是一個基于 Java 環(huán)境的開源機器學習工具包。主要應用于統(tǒng)計自然語言處理,文檔分類,聚類,主題建模,信息提取等文本類分析場景。

MALLET 內部實現(xiàn)了許多功能強大的工具,包括用于文檔分類的高級工具,用于序列標記的工具,和用于主題建模的工具等。MALLET 還支持各種類型的算法,包括樸素貝葉斯,決策樹和最大熵等。此外,MALLET 還提供了許多例程,包括分詞,刪除停用詞,將文本轉換為向量表示等。

ELKI

地址:

ELKI 的全稱是:Environment for Developing KDD-Applications Supported by Index-Structures,即由索引結構支持的 KDD 應用開發(fā)環(huán)境,這里 KDD 是指 Knowledge Discovery in Database,即知識發(fā)現(xiàn)。

ELKI 也是一款知名的基于 Java 環(huán)境的數(shù)據(jù)挖掘軟件。ELKI 的重點是算法研究,強調聚類分析,數(shù)據(jù)庫索引和孤立點檢測等無監(jiān)督方法。ELKI 可以對數(shù)據(jù)挖掘算法和數(shù)據(jù)管理任務進行各自獨立的分析,這在其他數(shù)據(jù)挖掘框架(如 Weta 和 Rapidminer)中是獨一無二的。此外,ELKI 還支持各種數(shù)據(jù)類型和文件格式,以及各種相似性度量方法。

ELKI 專為研究人員和學生設計,提供了大量可靈活配置的算法參數(shù),以便進行簡單和公平的算法評估。目前 ELKI 已經(jīng)被廣泛應用于各種數(shù)據(jù)科學的相關領域,包括鯨魚的回聲定位,航天飛行操作,共享單車分配和交通預測等。

來源:jaxenter,雷鋒網(wǎng)編譯

本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
盤點:為Java開發(fā)者量身定制的五款機器學習庫
機器學習、數(shù)據(jù)挖掘、統(tǒng)計建模的技術擔當,20款免費預測分析軟件
Weka和R的比較
機器學習之開源庫大總結
數(shù)據(jù)挖掘工具
Java第三方工具庫/包匯總
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服