甲骨文公司日前宣布推出最新版本Oracle大數(shù)據(jù)機(jī)(Oracle Big Data Appliance)和Oracle大數(shù)據(jù)連接器(Oracle Big Data Connectors),旨在幫助企業(yè)贏得大數(shù)據(jù)發(fā)展機(jī)會(huì)以實(shí)現(xiàn)其業(yè)務(wù)轉(zhuǎn)型。
Oracle大數(shù)據(jù)機(jī)X3-2是一個(gè)頗具成本效益的軟硬件集成系統(tǒng),并且已經(jīng)進(jìn)行了全新升級(jí)。它整合了Intel全新處理器和最新發(fā)布的Cloudera分區(qū),包括Apache Hadoop(CDH)和Cloudera管理器,以及用于大數(shù)據(jù)機(jī)的最新Oracle企業(yè)管理器插件等。
最新版本的Oracle大數(shù)據(jù)連接器的性能得到了大幅提升,可以更大地支持SQL語(yǔ)言訪問(wèn)來(lái)自O(shè)racle數(shù)據(jù)庫(kù)的Hadoop,并能更透明地訪問(wèn)來(lái)自R分區(qū)的Hadoop。
Oracle大數(shù)據(jù)機(jī)及Oracle大數(shù)據(jù)連接器可與Oracle Exadata數(shù)據(jù)庫(kù)云服務(wù)器和Oracle Exalytics商務(wù)智能云服務(wù)器聯(lián)合使用,組成一套完整的集成系統(tǒng),獲取、組織并分析大數(shù)據(jù)。最新版本提供了更強(qiáng)大的處理能力、內(nèi)存容量、以及增強(qiáng)的集成和管理能力。
最近,由美國(guó)國(guó)家癌癥研究所(NCI)資助的Frederick國(guó)家圖書館,借助Oracle大數(shù)據(jù)機(jī)及其Apache Hadoop(CDH)Cloudera分區(qū),實(shí)現(xiàn)了 2000萬(wàn)生物樣本間進(jìn)行17000個(gè)基因與五大癌癥亞型的關(guān)系對(duì)照檢索。,從而贏得了2012 年政府大數(shù)據(jù)解決方案獎(jiǎng)。
Oracle大數(shù)據(jù)機(jī)X3-2硬件包含最新的8核Intel Xeon E5-2600系列處理器。與上一代相比,基于其18個(gè)、擁有648 TB原始存儲(chǔ)的計(jì)算與存儲(chǔ)服務(wù)器,可以實(shí)現(xiàn):通過(guò)288個(gè)CPU內(nèi)核,提升33%的處理能力;通過(guò)1.1 TB主內(nèi)存,提升每個(gè)節(jié)點(diǎn)33%以上的內(nèi)存能力;節(jié)省高達(dá)30%的電力和冷卻耗能。
Oracle大數(shù)據(jù)機(jī)X3-2通過(guò)集成獲取、組織和分析大數(shù)據(jù)所需的硬件和軟件,進(jìn)一步簡(jiǎn)化了大數(shù)據(jù)的實(shí)施和管理,包括:支持與Cloudera共同開(kāi)發(fā)的軟件升級(jí)在內(nèi)的CDH4.1,進(jìn)一步簡(jiǎn)化在Hadoop中的NameNode高可用性,同時(shí)可消除某個(gè)Hadoop集群的單點(diǎn)故障;Oracle NoSQL數(shù)據(jù)庫(kù)社區(qū)版本2.0的最新版本,實(shí)現(xiàn)了更好的Hadoop集成性、彈性擴(kuò)展性以及新的應(yīng)用程序界面(APIs),還提供了對(duì)JSON和C等語(yǔ)言的支持;大數(shù)據(jù)機(jī)自帶的Oracle企業(yè)管理器插件,完善了Cloudera管理器,使用戶能夠更輕松地管理Hadoop集群;Oracle Linux分區(qū)和Oracle Java開(kāi)發(fā)工具套件升級(jí)包;開(kāi)源R分區(qū)升級(jí)包,針對(duì)高性能多線程數(shù)學(xué)庫(kù)進(jìn)行了優(yōu)化。
Oracle大數(shù)據(jù)連接器是一套內(nèi)置軟件,旨在實(shí)現(xiàn) Apache Hadoop與Oracle數(shù)據(jù)庫(kù)、Oracle數(shù)據(jù)集成器以及Oracle R 分區(qū)之間的集成。
增強(qiáng)的Oracle大數(shù)據(jù)連接器,提升了數(shù)據(jù)集成功能。通過(guò)每一個(gè)連接器的更新,該版本包括:面向Hadoop分布式文件系統(tǒng)的Oracle SQL連接器,以及用于Oracle數(shù)據(jù)庫(kù)Hadoop數(shù)據(jù)的高性能SQL查詢,通過(guò)提高自動(dòng)化程度和Hive表查詢,可實(shí)現(xiàn)用于Hadoop的Oracle數(shù)據(jù)集成應(yīng)用程序適配器的支持;對(duì)來(lái)自R分區(qū)的Hive查詢語(yǔ)言的透明訪問(wèn),以及引進(jìn)了在Hadoop中原生運(yùn)行的最新分析技術(shù),使R開(kāi)發(fā)人員更易于訪問(wèn)R分區(qū)中的Hadoop,從而顯著提升其工作效率。
甲骨文公司數(shù)據(jù)倉(cāng)庫(kù)及大數(shù)據(jù)技術(shù)副總裁Cetin Ozbutun 表示:“當(dāng)前,原始數(shù)據(jù)正大量涌入每個(gè)企業(yè)。然而對(duì)于企業(yè)來(lái)說(shuō),他們并沒(méi)有做好準(zhǔn)備。在充分發(fā)揮這些數(shù)據(jù)的潛力之前,企業(yè)還需要知道如何組織這些多樣化的數(shù)據(jù)源。此次發(fā)布的最新版本,進(jìn)一步提高了客戶在這一方面的能力,幫助他們可以優(yōu)化大數(shù)據(jù)工作負(fù)載并將其與數(shù)據(jù)倉(cāng)庫(kù)實(shí)現(xiàn)集成,使企業(yè)可以輕松分析所有的數(shù)據(jù)。”
Cloudera公司首席執(zhí)行官M(fèi)ike Olson表示:“越來(lái)越多的企業(yè)渴求成熟、可靠且面向企業(yè)需求的工具,以支持其大數(shù)據(jù)項(xiàng)目。由Cloudera支持的Oracle大數(shù)據(jù)機(jī)針對(duì)Hadoop進(jìn)行了優(yōu)化,為企業(yè)提供了一個(gè)易于管理的Hadoop平臺(tái),從而全面滿足當(dāng)前企業(yè)對(duì)大數(shù)據(jù)發(fā)展的需求”。