近日,據(jù)美聯(lián)社官網(wǎng)報道,MapD Technologies將MapD Core數(shù)據(jù)庫發(fā)布到了開源社區(qū)。MapD是使用圖形處理單元(GPU)以毫秒為單位分析數(shù)十億行數(shù)據(jù)的先驅(qū),比傳統(tǒng)的基于CPU的數(shù)據(jù)庫快幾個數(shù)量級。MapD Core數(shù)據(jù)庫及其可視化庫開源讓每個人都可以使用這個世界上最快的分析平臺。
Todd是MapD Technologies創(chuàng)始人兼首席執(zhí)行官,據(jù)其博客介紹,他們在5年前開始MapD項(xiàng)目時就一直希望將其開源,當(dāng)時沒有那么做,是因?yàn)樗麄兿M却a庫成熟?,F(xiàn)在,他們注意到,整個GPU ML和深度學(xué)習(xí)技術(shù)棧都是開源的,但卻沒有一個開源的數(shù)據(jù)處理引擎。開源MapD Core數(shù)據(jù)庫就是為了填補(bǔ)這項(xiàng)空白。開源讓他們可以和生態(tài)系統(tǒng)的其他部分整合。同時,他們還宣布,和Continuum Analytics及H2O.ai成立了GPU Open Analytics Initiative(GOAI),并公布了第一個項(xiàng)目GPU Data Frame(GDF)。該項(xiàng)目可以實(shí)現(xiàn)數(shù)據(jù)在GPU進(jìn)程之間的高效交換,而且避免了復(fù)制數(shù)據(jù)的開銷。
此次開源包含如下內(nèi)容:
MapD Core開源數(shù)據(jù)庫——MapD Core數(shù)據(jù)庫源代碼遵循Apache 2許可協(xié)議,提供了SQL查詢多GPU加速所需要的一切; MapD可視化庫——MapD提供了開源的JavaScript庫,讓用戶可以構(gòu)建基于MapD Core數(shù)據(jù)庫的定制化Web可視化應(yīng)用。該庫包含生成圖表、交叉篩選數(shù)據(jù)及管理MapD Core數(shù)據(jù)庫連接的功能。其中,圖表和交叉篩選庫基于流行的Dimensional Charting項(xiàng)目(DC.js )。同時,他們還公布了MapD分析平臺企業(yè)版,其中包括MapD Core數(shù)據(jù)庫、MapD Core GPU渲染引擎及MapD Immerse可視化分析客戶端。它還提供了開源版本不具備的分布式擴(kuò)展、高可用(HA)、LDAP及ODBC特性。他們的路線圖上還有其他后續(xù)會增加到企業(yè)版的特性,尤其是在安全方面。
此外,MapD還發(fā)布了一個社區(qū)版本,供非商業(yè)開發(fā)和學(xué)術(shù)使用。MapD社區(qū)版遵循非商業(yè)性的學(xué)術(shù)許可,包含MapD Core數(shù)據(jù)庫、GPU渲染引擎及MapD Immerse可視化分析客戶端。
這一消息引起了廣泛的反響。New Enterprise Associates投資合伙人Greg Papadopoulos表示:
一個開源的GPU數(shù)據(jù)庫將會讓全新的應(yīng)用程序成為可能,尤其是在機(jī)器學(xué)習(xí)方面,GPU在這方面的影響是如此之大。和MapD合作,我們非常自豪,因?yàn)樗~出了關(guān)鍵的一步。
加州大學(xué)教授John Owens則表示:
我的研究小組主要是針對并行計算設(shè)備,尤其是GPU,開發(fā)更快的算法。一段時間以來,MapD正在做的工作給我們留下了深刻的印象,只是希望我們可以在研究中把它作為真實(shí)世界的測試平臺?,F(xiàn)在,他們開源了自己的數(shù)據(jù)庫產(chǎn)品,我們的團(tuán)隊(duì)很高興將其作為研究平臺,并向其代碼庫做貢獻(xiàn)。
DGX Systems NVIDIA總經(jīng)理Jim McHugh認(rèn)為,MapD開源Core數(shù)據(jù)庫的決定意義重大,它進(jìn)一步激勵了本來就已經(jīng)很活躍的GPU分析社區(qū)。
要了解更多信息,請點(diǎn)擊這里。感興趣的讀者也可以加入官方論壇。