大數(shù)據(jù)迎來開源時代 開源熱點盤點
伴隨著交易型IT到交互型IT的過渡,過去幾年中企業(yè)數(shù)據(jù)呈現(xiàn)爆炸性增長。社交媒體的興起、智能終端的廣泛使用等導(dǎo)致各種海量數(shù)據(jù)的快速產(chǎn)生,同時為我們開啟了大數(shù)據(jù)時代。隨著大數(shù)據(jù)時代的到來,我們也迎來了開源時代,為什么這么說呢? 談及大數(shù)據(jù),也不得不提云計算,在大數(shù)據(jù)+云計算時代里,開源變成了香餑餑,因為用戶想要的是更多的自由,于是乎廠商就開始在自己的產(chǎn)品上貼上開放的標(biāo)簽,開始談開源的好處,因為它曾承諾能夠降低成本同時獲得企業(yè)級的IT自由度。所以我們看到了Hadoop人氣居高不下,這就是自由的號召力。 但是在開源風(fēng)行的這幾年,又有幾家開源企業(yè)真的做的不錯呢?小編就帶大家盤點一下最近的開源熱點吧! Hadoop ![]() Hadoop Hadoop 無疑使目前最熱的開源技術(shù),因為它曾承諾能夠降低成本同時獲得企業(yè)級的IT自由度。最終,只有幾個新興企業(yè)投資(MySQL, JBoss),但是對于大部分的企業(yè)而言,真正的價值來自IT供應(yīng)商和內(nèi)部的IT組織,利用開源為他們的軟件項目提供原材料。開源越來越不關(guān)于銷售,而是代碼,這也正是設(shè)計它的目的所在。 Hadoop 是最受歡迎的在 Internet 上對搜索關(guān)鍵字進行內(nèi)容分類的工具,但它也可以解決許多要求極大伸縮性的問題。例如,如果您要 grep 一個 10TB 的巨型文件,會出現(xiàn)什么情況?在傳統(tǒng)的系統(tǒng)上,這將需要很長的時間。但是 Hadoop 在設(shè)計時就考慮到這些問題,采用并行執(zhí)行機制,因此能大大提高效率。 Hadoop如此受歡迎是由原因的,它帶來了諸多優(yōu)點。Hadoop 是一個能夠?qū)Υ罅繑?shù)據(jù)進行分布式處理的軟件框架,而且Hadoop 是以一種可靠、高效、可伸縮的方式進行處理的??煽啃泽w現(xiàn)在它是假設(shè)計算元素和存儲會失敗,因此它維護多個工作數(shù)據(jù)副本,確保能夠針對失敗的節(jié)點重新分布處理。高效性則體現(xiàn)在它以并行的方式工作,通過并行處理加快處理速度。Hadoop 還是可伸縮的,能夠處理 PB 級數(shù)據(jù)。此外,Hadoop 依賴于社區(qū)服務(wù)器,因此它的成本比較低,任何人都可以使用。 OpenStack ![]() OpenStack OpenStack是一個美國國家航空航天局和Rackspace合作研發(fā)的云端運算?軟件,以Apache許可證授權(quán),并且是一個自由軟件和開放源代碼項目。 自從2010年推出以來,OpenStack迅速贏得了惠普、英特爾和戴爾等云計算領(lǐng)域的IT公司的支持。OpenStack的貢獻者喜歡把自己的工作稱作增長速度最快的開源軟件項目,參加者包括144家公司和2100多人。戴爾推出一個名為戴爾OpenStack云解決方案的軟件包,把OpenStack與戴爾自己的服務(wù)器和軟件結(jié)合在了一起。惠普也推出一個采用這個技術(shù)的測試版的公共云服務(wù)。 管理的托管提供商Rackspace的首席技術(shù)官約翰·安格斯(John Engates)說,為了幫助更廣泛地應(yīng)用,OpenStack正在配置許多新的功能,使這個軟件更適合企業(yè)應(yīng)用。一個名為“Keystone”的項目允許機構(gòu)把OpenStack與自己的身份管理系統(tǒng)結(jié)合起來,或者與基于微軟主動目錄或者其它LDAP(輕型目錄訪問協(xié)議)的身份管理系統(tǒng)結(jié)合起來。此外,開發(fā)人員也正在為這個軟件開發(fā)一個前端門戶。Rackspace還將把這個項目剝離為一個完全獨立的實體,希望它成為更多的云提供商的一個誘人的選擇。 安格斯稱,2011年將是這個產(chǎn)品打基礎(chǔ)的一年。但是,我認(rèn)為,2012年我們將真正開始利用這個基礎(chǔ)在許多私有云和公共云中使用。 Apache ![]() Apache Apache是世界使用排名第一的Web服務(wù)器軟件。它可以運行在幾乎所有廣泛使用的計算機平臺上。 Apache的誕生極富有戲劇性。當(dāng)NCSAWWW服務(wù)器項目停頓后,那些使用NCSA WWW服務(wù)器的人們開始交換他們用于該服務(wù)器的補丁程序,他們也很快認(rèn)識到成立管理這些補丁程序的論壇是必要的。就這樣,誕生了Apache Group,后來這個團體在NCSA的基礎(chǔ)上創(chuàng)建了Apache。 原本它只用于小型或試驗Internet網(wǎng)絡(luò),后來逐步擴充到各種Unix系統(tǒng)中,尤其對Linux的支持相當(dāng)完美。Apache有多種產(chǎn)品,可以支持SSL技術(shù),支持多個虛擬主機。Apache是以進程為基礎(chǔ)的結(jié)構(gòu),進程要比線程消耗更多的系統(tǒng)開支,不太適合于多處理器環(huán)境,因此,在一個Apache Web站點擴容時,通常是增加服務(wù)器或擴充群集節(jié)點而不是增加處理器。到目前為止Apache仍然是世界上用的最多的Web服務(wù)器,市場占有率達(dá)60%左右。世界上很多著名的網(wǎng)站如Amazon、Yahoo!、W3 Consortium、Financial Times等都是Apache的產(chǎn)物,它的成功之處主要在于它的源代碼開放、有一支開放的開發(fā)隊伍、支持跨平臺的應(yīng)用(可以運行在幾乎所有的Unix、Windows、Linux系統(tǒng)平臺上)以及它的可移植性等方面。 MySQL ![]() MySQL MySQL是一個小型關(guān)系型數(shù)據(jù)庫管理系統(tǒng),開發(fā)者為瑞典MySQL AB公司。在2008年被Sun公司收購,2009年,SUN又被Oracle收購。 MySQL是一種關(guān)聯(lián)數(shù)據(jù)庫管理系統(tǒng),關(guān)聯(lián)數(shù)據(jù)庫將數(shù)據(jù)保存在不同的表中,而不是將所有數(shù)據(jù)放在一個大倉庫內(nèi)。這樣就增加了速度并提高了靈活性。MySQL的SQL“結(jié)構(gòu)化查詢語言”。SQL是用于訪問數(shù)據(jù)庫的最常用標(biāo)準(zhǔn)化語言。MySQL軟件采用了GPL(GNU通用公共許可證)。由于其體積小、速度快、總體擁有成本低,尤其是開放源碼這一特點,許多中小型網(wǎng)站為了降低網(wǎng)站總體擁有成本而選擇了MySQL作為網(wǎng)站數(shù)據(jù)庫。 與其他的大型數(shù)據(jù)庫例如Oracle、DB2、SQL Server等相比,MySQL自有它的不足之處,如規(guī)模小、功能有限(MySQL Cluster的功能和效率都相對比較差)等,但是這絲毫也沒有減少它受歡迎的程度。對于一般的個人使用者和中小型企業(yè)來說,MySQL提供的功能已經(jīng)綽綽有余,而且由于MySQL是開放源碼軟件,因此可以大大降低總體擁有成本。 目前Internet上流行的網(wǎng)站構(gòu)架方式是LAMP(Linux+Apache+MySQL+PHP/Perl/Python)和LNMP(Linux+Nginx+MySQL+php/perl/Python),即使用Linux作為操作系統(tǒng),Apache和Nginx作為Web服務(wù)器,MySQL作為數(shù)據(jù)庫,PHP/Perl/Python作為服務(wù)器端腳本解釋器。由于這四個軟件都是免費或開放源碼軟件(FLOSS),因此使用這種方式不用花一分錢(除開人工成本)就可以建立起一個穩(wěn)定、免費的網(wǎng)站系統(tǒng)。 Asterisk ![]() Asterisk Asterisk是一個開放源代碼的軟件VoIP PBX系統(tǒng),它是一個運行在Linux環(huán)境下的純軟件實施方案。Asterisk是一種功能非常齊全的應(yīng)用程序,提供了許多電信功能,能夠把你的x86機 器變成你自己的交換機,還能夠當(dāng)作一臺企業(yè)級的商用交換機。Asterisk讓人激動的事情是它在小企業(yè)預(yù)算可承受的范圍內(nèi)提供了商業(yè)交換機的功能和可伸 縮性。你可以使用一臺老式的奔騰3計算機,讓你的機構(gòu)看起來就同世界上的大企業(yè)一樣。 事實上,Asterisk開源項目經(jīng)過十多年的發(fā)展,已經(jīng)不再單獨局限于IP-PBX的應(yīng)用。實際上,按照,Digium在其asterisk論壇上給出的說法,Asterisk軟件已經(jīng)是一個平臺,不僅可以用于IP-PBX的開發(fā),也可以用于中繼網(wǎng)關(guān)(TG),模擬電話適配器(ATA - Analog Telephone Adapter),甚至 IP Phone 產(chǎn)品的開發(fā)。 同時,Asterisk開源項目已經(jīng)逐步發(fā)展稱為一個 “統(tǒng)一通信” (UC)的解決方案。 Asterisk開源項目應(yīng)用的另一個變化是在嵌入式領(lǐng)域的發(fā)展。雖然最初Asterisk是基于X86主機加PCI擴展板卡運行的。但目前,一些基于MIPS或ARM的CPU也已經(jīng)都可以運行Asterisk。其中比較著名的有OpenWRT,在OpenWRT的最新版本中已經(jīng)包含了對Asterisk 1.6/1.8 版本的支持,簡單的編譯后既可在MIPS或ARM的硬件平臺上運行(參考Asterisk On MIPS論壇)。 (責(zé)任編輯:陳曲) 關(guān)鍵詞:大數(shù)據(jù) 開源 大數(shù)據(jù)開源時代 熱點盤點 |