從大數(shù)據(jù)到認(rèn)知計(jì)算,未來需要更強(qiáng)的計(jì)算能力

責(zé)任編輯:editor004

2016-03-14 11:24:37

摘自:CSDN 云計(jì)算頻道

認(rèn)知計(jì)算和大數(shù)據(jù)分析有類似的技術(shù),比如大量的數(shù)據(jù)、機(jī)器學(xué)習(xí)(MachineLearning)、行業(yè)模型等,大數(shù)據(jù)分析更多強(qiáng)調(diào)的是獲得洞察,通過這些洞察進(jìn)行預(yù)測(cè)。

認(rèn)知計(jì)算是IBM提出的概念,認(rèn)為“認(rèn)知計(jì)算”是通過與人的自然語言交流及不斷地學(xué)習(xí),從而幫助人們做到更多的系統(tǒng),是從硬件架構(gòu)到算法策略、從程序設(shè)計(jì)到行業(yè)專長(zhǎng)等多個(gè)學(xué)術(shù)領(lǐng)域的結(jié)合,能夠使人們更好地從海量復(fù)雜的數(shù)據(jù)中獲得更多洞察,從而做出更為精準(zhǔn)的決策。IBM清晰地把認(rèn)知計(jì)算定義為——具備規(guī)?;瘜W(xué)習(xí)、根據(jù)目標(biāo)推理以及與人類自然互動(dòng)能力的系統(tǒng)。

大數(shù)據(jù)

  認(rèn)知計(jì)算和大數(shù)據(jù)分析有何區(qū)別?

大數(shù)據(jù)分析屬于認(rèn)知計(jì)算的一個(gè)維度。與大數(shù)據(jù)相比,認(rèn)知計(jì)算的范圍更廣、技術(shù)也更為先進(jìn)。

認(rèn)知計(jì)算和大數(shù)據(jù)分析有類似的技術(shù),比如大量的數(shù)據(jù)、機(jī)器學(xué)習(xí)(MachineLearning)、行業(yè)模型等,大數(shù)據(jù)分析更多強(qiáng)調(diào)的是獲得洞察,通過這些洞察進(jìn)行預(yù)測(cè)。此外,傳統(tǒng)的大數(shù)據(jù)分析會(huì)使用模型或者機(jī)器學(xué)習(xí)的方法,但更多的是靠專家提供。

對(duì)于認(rèn)知計(jì)算而言,洞察和預(yù)測(cè)只是其中的一種。但是,認(rèn)知計(jì)算更為強(qiáng)調(diào)人和機(jī)器之間自然的交互,這些維度都不是傳統(tǒng)的大數(shù)據(jù)分析所強(qiáng)調(diào)。

此外,認(rèn)知計(jì)算目前成長(zhǎng)很快的一個(gè)領(lǐng)域?yàn)樯疃葘W(xué)習(xí)(DeepLearning),它的學(xué)習(xí)方法與傳統(tǒng)方法不同,更多的是基于大量的數(shù)據(jù)通過自學(xué)的方式得到這樣的模型,而不需要很多的人為干預(yù),這個(gè)從學(xué)習(xí)方法來講和大數(shù)據(jù)分析有很多不同的地方。

CPU、GPU、ASIC等傳統(tǒng)計(jì)算資源的瓶頸

近十年來,人工智能又到了一個(gè)快速發(fā)展的階段。深度學(xué)習(xí)在其發(fā)展中起到了中流砥柱的作用,盡管擁有強(qiáng)大的模擬預(yù)測(cè)能力,深度學(xué)習(xí)還面臨著超大計(jì)算量的問題。在硬件層面上,GPU、ASIC、FPGA都是解決龐大計(jì)算量的方案。

在2006年的時(shí)候,人們還是用串行處理器處理機(jī)器學(xué)習(xí)的問題,當(dāng)時(shí)Mutch 和 Lowe開發(fā)了一個(gè)工具FHLib(feature hierarchy library)用來處理hierarchical 模型。對(duì)于CPU來說,它所要求的編程量是比較少的并且有可遷移性的好處,但是串行處理的特點(diǎn)變成了它在深度學(xué)習(xí)領(lǐng)域的缺點(diǎn),而這個(gè)缺點(diǎn)是致命的。時(shí)至今日,據(jù)2006年已經(jīng)過去了十年,過去的十年集成電路的發(fā)展還是遵循著摩爾定律,CPU的性能得到了極大的提升,然而,這并沒有讓CPU再次走入深度學(xué)習(xí)研究者的視野。盡管在小數(shù)據(jù)集上CPU能有一定的計(jì)算能力表現(xiàn),多核使得它能夠并行處理,然而這對(duì)深度學(xué)習(xí)來說還是遠(yuǎn)遠(yuǎn)不夠的。

GPU:雖然走進(jìn)了研究者的視線,相比于CPU,GPU的核心數(shù)大大提高了,這也讓它有更強(qiáng)大的并行處理能力,它還有更加強(qiáng)大的控制數(shù)據(jù)流和儲(chǔ)存數(shù)據(jù)的能力。在 Chikkerur進(jìn)行了CPU和GPU在處理目標(biāo)識(shí)別能力上的差別,最終GPU的處理速度是CPU的3-10倍。

ASIC:專用集成電路芯片(ASIC)由于其定制化的特點(diǎn),是一種比GPU更高效的方法。但是其定制化也決定了它的可遷移性低,一旦專用于一個(gè)設(shè)計(jì)好的系統(tǒng)中,要遷移到其它的系統(tǒng)是不可能的。并且,其造價(jià)高昂,生產(chǎn)周期長(zhǎng),使得它在目前的研究中是不被考慮的。

FPGA是計(jì)算的未來?

FPGA:FPGA在GPU和ASIC中取得了權(quán)衡,很好的兼顧了處理速度和控制能力。一方面,F(xiàn)PGA是可編程重構(gòu)的硬件,因此相比GPU有更強(qiáng)大的可調(diào)控能力;另一方面,與日增長(zhǎng)的門資源和內(nèi)存帶寬使得它有更大的設(shè)計(jì)空間。更方便的是,F(xiàn)PGA還省去了ASIC方案中所需要的流片過程。FPGA的一個(gè)缺點(diǎn)是其要求使用者能使用硬件描述語言對(duì)其進(jìn)行編程。但是,已經(jīng)有科技公司和研究機(jī)構(gòu)開發(fā)了更加容易使用的語言比如Impulse Accelerated Technologies Inc. 開發(fā)了C-to-FPGA編譯器使得FPGA更加貼合用戶的使用,耶魯?shù)腅-Lab則開發(fā)了Lua腳本語言。這些工具在一定程度上縮短了研究者的開發(fā)時(shí)限,使研究更加簡(jiǎn)單易行。

Linux On Power+GPU+FPGA=面向未來的認(rèn)知計(jì)算

創(chuàng)新的Linux on power結(jié)合FPGA、GPU的計(jì)算模式,這也許是面向未來的認(rèn)知計(jì)算最佳架構(gòu)。

IBM在2015年宣布了與FPGA芯片設(shè)計(jì)商Xilinx進(jìn)行“為期數(shù)年的戰(zhàn)略協(xié)作”。兩家公司將聯(lián)起手來,通過OpenPOWER Foundation致力于找到更好的方法處理機(jī)器學(xué)習(xí)、網(wǎng)絡(luò)功能虛擬化(NFV)、基因、高性能計(jì)算和大數(shù)據(jù)分析等應(yīng)用程序。

IBM的開發(fā)人員將針對(duì)OpenStack、Docker和Spark建立解決方案堆棧,結(jié)合了基于POWER的服務(wù)器,并具備Xilinx FPGA加速器。

此外,McCredie還宣布該公司將把POWER 8芯片同Nvidia Tesla K80 GPUs結(jié)合在一起,使用NVIDIA的高速NVLINK互聯(lián)。兩家OEM——Penguin Computing和E4 Engineering將會(huì)把基于OpenPOWER設(shè)計(jì)理念的系統(tǒng)推向市場(chǎng)。

據(jù)IBM內(nèi)部測(cè)試顯示,與基于英特爾E5-2699 V3處理器的服務(wù)器相比,新Power Systems LC服務(wù)器能夠以不到前者一半的成本運(yùn)行Twitter簡(jiǎn)訊分析、網(wǎng)頁(yè)視圖顯示等數(shù)據(jù)密集型工作負(fù)載,為客戶每一美元的成本支出提供領(lǐng)先于前者2.3倍的性能。憑借其高效率的設(shè)計(jì),LC服務(wù)器在相同的機(jī)架空間里能夠比基于英特爾處理器的同等服務(wù)器多運(yùn)行94%的Spark社交媒體工作負(fù)載。

用于商業(yè)計(jì)算和高性能計(jì)算的2插座2U Power Systems S822LC配備最多20個(gè)核、1TB內(nèi)存和230GB/秒內(nèi)存帶寬。用于高性能計(jì)算的S822LC還配備NVIDIA特斯拉加速計(jì)算平臺(tái)的旗艦組件——兩個(gè)集成的NVIDIA Tesla K80 GPU加速器。與配置類似、基于x86架構(gòu)的E5-2699 V3服務(wù)器相比,兩款S822LC產(chǎn)品能夠提供領(lǐng)先于前者逾2倍的單核性能、高于前者40%的性價(jià)比以及在滿內(nèi)存配置情況下超過2倍的內(nèi)存帶寬。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)