中科院計算所剛剛做了十二五規(guī)劃,其中有一個很有意思的名詞”HTC”,而且這個名詞居然排在龍芯的前面。HTC即高通量計算機,High-through computing.本文絕大部分內(nèi)容取材自這里。穿插自己的理解。
高通量計算是計算機科學中用于描述使用很多計算資源,在很長的時間內(nèi)完成計算任務的一種計算方式。幾個關(guān)鍵點:長時間,很多計算資源一起參與。所以,高通量計算需要更多的考慮長時間的健壯性和可靠性。這些大量的計算資源本身是不可靠的,用這些不可靠的資源構(gòu)建可靠的高通量計算服務,確實是個大的挑戰(zhàn)。這個應該和目前熱門的云計算差不多。不過云計算主要在存儲上,而高通量計算則偏重計算能力。
高通量計算(HTC)、高性能計算(HPC)和多任務計算(MTC)還有很多的不同。HPC側(cè)重短時間高性能的計算服務,HTC則在提供高性能的同時側(cè)重長時間穩(wěn)定的服務。HPC可能經(jīng)常使用FLOPS(Floating point operations per second).而HTC則可能用FLOPM(per month)或者FLOPY(per year)來衡量。
HPC執(zhí)行的任務可能是有很多緊密聯(lián)系的并行任務構(gòu)成,而HTC則可能需要將獨立的串行任務在很多不同的計算資源上做獨立調(diào)度。通常HTC需要使用網(wǎng)格計算技術(shù)實現(xiàn)。
MTC則可能更像一個中和HTC和HPC的角色。通常關(guān)注于使用多個計算資源在短時間內(nèi)完成多個計算任務,這些任務可以是獨立的或者相互依賴的。量化衡量標準也很多FLOPS,每秒執(zhí)行任務數(shù)等等,以秒為單位來量化。
目前成熟的高通量計算機有:威斯康星大學麥迪遜分校的Condor HTC系統(tǒng)和美國國家航空航天局的PBS系統(tǒng)。
為什么需要這類計算?其實現(xiàn)在我們用電腦,基本都是,開機,做事情,關(guān)機。手機這種即使長時間需要開機,也要不停的充電,或者重啟。到了所謂的物聯(lián)網(wǎng)時代,很多的計算服務可能需要長年累月的在某個地方運行,沒有人負責開機和關(guān)機事宜。另外一方面,在這些傳感器信息最終匯集的地方,也需要持久高性能的計算保證。高通量計算有什么挑戰(zhàn)?其實是老生常談的問題,看看Google,淘寶的后臺都遇到一些什么問題,就是高通量計算需要面對的問題。關(guān)鍵是可靠性和安全,當然還有能耗。
這文章好空洞,恩。給個關(guān)于高通量計算機的架構(gòu)圖吧,雖然我沒怎么看懂。來自這里