選擇合適的技術進行大數據分析

責任編輯:jacky

2014-08-07 08:39:08

摘自:論壇

大數據的能量和其為企業(yè)帶來的競爭力優(yōu)勢已經逐漸顯現,現在大數據已經成為商業(yè)智能、分析和數據管理市場領域中討論度最高的話題之一,當然也是最熱門的流行語之一。企業(yè)在在制定實施方案、對大數據基礎設施進行選型之前,還需要考慮一些問題,比如數據及時性

大數據的能量和其為企業(yè)帶來的競爭力優(yōu)勢已經逐漸顯現,現在大數據已經成為商業(yè)智能、分析和數據管理市場領域中討論度最高的話題之一,當然也是最熱門的流行語之一。此外,企業(yè)已經看到了將大數據與云計算綁定所帶來的好處。云計算提供可擴展性,使得其成為大數據分析的實踐之車。

對于企業(yè)而言,大數據不僅是個熱門話題,更是真切的需求所在。許多企業(yè)開始著手于大數據分析項目,但是現在,越來越多的企業(yè)存儲的信息量就算不是PB級,起碼也有TB量級。這些企業(yè)可能希望每天能分析幾次關鍵數據,甚至是實現實時分析;而傳統(tǒng)BI流程對歷史數據進行分析的頻率是以周或月為單位的。

此外,越來越多復雜查詢的處理帶來了各種不同的數據集,其中有可能包含來自企業(yè)資源計劃(ERP)系統(tǒng)和客戶關系管理(CRM)系統(tǒng)交易數據、社交媒介和地理空間數據,還有內部文檔和其它格式信息等等。

要進行大數據分析,選擇合適的技術是規(guī)劃的第一部分,企業(yè)選擇了數據庫軟件、分析工具以及相關的技術架構后,才可以進行下一步并開發(fā)一個真正成功的大數據平臺。技術供應商處理這些需求的方式是多種多樣的。許多數據庫和數據倉庫供應商都在關注及時處理大量復雜數據的能力。有的用列式數據存儲來實現更快速的查詢,有的提供內建的查詢優(yōu)化器,有的增加對Hadoop和MapReduce這類開源技術的支持功能。

內存分析工具可能對分析處理速度的提升有所幫助,因為它能減少磁盤數據轉換的需求;而數據虛擬化軟件和其它實時數據集成技術可對運行中不同數據源的信息進行收集。對于垂直市場而言,現成的分析應用程序都是專門為其定制的,因為諸如電信、金融服務和網絡游戲這些行業(yè)都必須處理大數據。當公司管理人員和業(yè)務經理需要查看大數據分析查詢結果時,數據可視化工具可以簡化其流程。

企業(yè)在在制定實施方案、對大數據基礎設施進行選型之前,還需要考慮一些問題,比如數據及時性,因為并不是所有數據庫都支持實時數據可用性。各種數據源需要與數據關聯性和業(yè)務規(guī)則復雜度進行鏈接,以獲得一個包含企業(yè)績效、銷售機會、客戶行為、風險因素和其它業(yè)務指標的全面視圖。由于分析的需要,歷史數據的數量也需考慮在內。如果我們需要五年的數據,而一個數據源只包含兩年的信息,那么該怎么辦呢?然,這些因素并不能從根本上影響需求的規(guī)劃,但是它們可以幫助企業(yè)部署大數據分析系統(tǒng)、選擇最為合適的技術。

大數據正在以穩(wěn)定的步伐滲透到各行各業(yè),未來我們的生活中大數據的應用會越來越多,而對于企業(yè)而言,其整個企業(yè)的信息質量會變得更好,而且信息能夠更高效的得到利用。

鏈接已復制,快去分享吧

企業(yè)網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號