大數(shù)據(jù)本身就具有快速變化的特點。能說是大數(shù)據(jù),它往往指的就是在可承受的時間范圍內(nèi),使用計算機中的常用軟件工具,對大數(shù)據(jù)施以捕捉或是管理乃至進行處理的一個數(shù)據(jù)集合。大數(shù)據(jù)容易捕捉,但也容易流逝,因為大數(shù)據(jù)具有量大、快速以及多樣和價值的特性。大數(shù)據(jù)的處理是需要一些新技術(shù)的,用一些新技術(shù)將那些海量的、高增長的和多樣化的大數(shù)據(jù)集合,處理為可被利用的有價值的數(shù)據(jù)資產(chǎn)。
大數(shù)據(jù)中海量數(shù)據(jù)的集合可大到在獲取以及存儲或是管理和分析方面能遠遠超出一些計算機數(shù)據(jù)庫軟件的應對功能。但人們研究大數(shù)據(jù),其用意和目的并不在于能將所有大數(shù)據(jù)都被捕捉到,其實,就現(xiàn)代技術(shù)而言,人們也無法將所有與數(shù)據(jù)都可全部捕捉到。不過,將已經(jīng)捕捉到的數(shù)據(jù)給予搜集或是存儲,也就能挖掘到其中蘊含的價值。
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義確實并不在于是人們掌握了多少龐大數(shù)據(jù)的信息,而是將那些已經(jīng)被掌握的數(shù)據(jù)信息用大數(shù)據(jù)技術(shù)進行一些專業(yè)化處理。其實,如果將大數(shù)據(jù)當做一種產(chǎn)業(yè),那么,這種大數(shù)據(jù)產(chǎn)業(yè)實現(xiàn)利潤的關(guān)鍵,就在于要提高對大數(shù)據(jù)的一些加工能力,,通過這種加工的能力進而實現(xiàn)大數(shù)據(jù)的價值。事實上,人們研究大數(shù)據(jù),就是要利用大數(shù)據(jù)的研究而實現(xiàn)其一定的價值,尤其是一些商企部門,對挖掘大數(shù)據(jù)研究更有其實在的意義。
從大數(shù)據(jù)分析技術(shù)上看,大數(shù)據(jù)跟計算機中的云計算之間的關(guān)系,就像一枚硬幣,一個如硬幣的正面,一個像硬幣的背面,它們之間是那樣的密不可分。不過處理大數(shù)據(jù),單單用一臺計算機是無法進行處理的。分析大數(shù)據(jù),需要采用計算機的分布式架構(gòu)。因為分析大數(shù)據(jù)的特點是要對很多很多的海量數(shù)據(jù)信息進行分布式地予以挖掘。
進行大數(shù)據(jù)分析和處理,是離不開計算機中云計算技術(shù)的,它需要依托計算機的分布式架構(gòu)以及分布式計算機的數(shù)據(jù)庫或是計算機的云存儲乃至計算機的虛擬技術(shù),否則,是無法對大數(shù)據(jù)進行分析和處理的。