大數(shù)據(jù)正經(jīng)歷成長(zhǎng)的煩惱

責(zé)任編輯:editor004

2014-03-12 11:10:43

摘自:科技日?qǐng)?bào)

提起大數(shù)據(jù),很多人都感覺略知一二;但大數(shù)據(jù)到底是什么,又很少有人能解釋清楚。中國(guó)電子學(xué)會(huì)秘書長(zhǎng)徐曉蘭委員指出,海量的信息儲(chǔ)存和挖掘,既是大數(shù)據(jù)的價(jià)值所在,也是它有別于傳統(tǒng)互聯(lián)網(wǎng)、可能對(duì)信息安全帶來的新隱患。

提起大數(shù)據(jù),很多人都感覺略知一二;但大數(shù)據(jù)到底是什么,又很少有人能解釋清楚。今年兩會(huì)期間,包括小米科技創(chuàng)始人雷軍、聯(lián)想集團(tuán)董事長(zhǎng)楊元慶、科大訊飛董事長(zhǎng)劉慶峰在內(nèi)的多位代表、委員都提出了與大數(shù)據(jù)相關(guān)的建議和提案,他們一方面希望從國(guó)家層面推動(dòng)大數(shù)據(jù)的發(fā)展,另一方面也對(duì)它在信息安全方面可能存在的隱患提出了警示。

大數(shù)據(jù)記錄了所有一切

一份調(diào)查顯示,2013年我國(guó)產(chǎn)生的數(shù)據(jù)總量超過0.8ZB,相當(dāng)于2009年全球的數(shù)據(jù)總量;而到2020年,一個(gè)普通中國(guó)家庭每年產(chǎn)生的數(shù)據(jù)量,將相當(dāng)于半個(gè)國(guó)家圖書館的信息儲(chǔ)量。

中國(guó)電子學(xué)會(huì)秘書長(zhǎng)徐曉蘭委員指出,海量的信息儲(chǔ)存和挖掘,既是大數(shù)據(jù)的價(jià)值所在,也是它有別于傳統(tǒng)互聯(lián)網(wǎng)、可能對(duì)信息安全帶來的新隱患。

“大數(shù)據(jù)時(shí)代,記錄了很多以往根本不可能或者不需要記錄的數(shù)據(jù),比如微博、朋友圈的內(nèi)容,上網(wǎng)產(chǎn)生的cookie,家庭水電氣使用的情況、汽車和大型設(shè)備上安裝的傳感器拿到的數(shù)據(jù)等。”社交數(shù)據(jù)分析公司獨(dú)到科技的CEO張文浩說,“如果這些信息都是‘孤島’,影響可能不大。但一旦相互關(guān)聯(lián),影響力會(huì)大得驚人。”

中科院信息工程所所長(zhǎng)田靜委員也表示,以往碎片化的數(shù)據(jù)只是盲人摸象,但現(xiàn)在這些碎片全都被存貯起來,通過相關(guān)性分析拼湊,“就知道象到底長(zhǎng)什么樣了”。

技術(shù)上的差距,也造成了大數(shù)據(jù)暫時(shí)的“不安全”。

“沒有自己的分析能力,我們?cè)趺茨芨闱宄男?shù)據(jù)是需要保護(hù)的?”

對(duì)于田靜的這個(gè)“問題”,國(guó)家信息化專家咨詢委員會(huì)副主任、中國(guó)工程院院士鄔賀銓提供的一組數(shù)據(jù)給出了答案——數(shù)據(jù)中,大約有一半是應(yīng)該保護(hù)的,但我們現(xiàn)在真正保護(hù)的“只有一半的一半”,很多數(shù)據(jù)在有意或無意當(dāng)中被獲取,“如果這些數(shù)據(jù)整合起來,被某些別有用心的人利用,會(huì)對(duì)安全造成很大的影響”。

徐曉蘭介紹,目前我國(guó)很多機(jī)構(gòu)和企業(yè)使用大數(shù)據(jù)分析軟件都是國(guó)外廠商生產(chǎn)的,特別是近幾年視頻等多媒體數(shù)據(jù)爆炸性增長(zhǎng),“這些數(shù)據(jù)都是異構(gòu)化的,這部分軟件是我們的短板”。

著名軍事專家尹卓委員則指出,現(xiàn)在互聯(lián)網(wǎng)所使用的服務(wù)器大都放在美國(guó),“自己沒有服務(wù)器怎么可能安全”?

另一方面,在田靜看來,缺乏大數(shù)據(jù)環(huán)境下的安全理念也是重要原因之一。“過去認(rèn)為無害的信息,在數(shù)據(jù)爆炸的今天,已經(jīng)完全不一樣了。觀念不改,是沒有秘密可保的。”

張文浩也認(rèn)為,國(guó)人缺乏這方面的意識(shí)。“在美國(guó),很多人都會(huì)要求不公開自己的隱私,或者主動(dòng)把自己的數(shù)據(jù)提供給某些特定的機(jī)構(gòu)使用;但在國(guó)內(nèi)幾乎沒有聽到過,大家也不知道什么類型的數(shù)據(jù)可能會(huì)有多大的風(fēng)險(xiǎn)。”

大數(shù)據(jù)或許也很“危險(xiǎn)”

張文浩認(rèn)為,很多人對(duì)于大數(shù)據(jù)的理解都只注意到數(shù)據(jù)的體量和統(tǒng)計(jì),“其實(shí),通過深度分析,從紛繁的數(shù)據(jù)中抽象出規(guī)則和原理,并實(shí)現(xiàn)對(duì)未來的前瞻性預(yù)測(cè),才是大數(shù)據(jù)真正的價(jià)值和魅力所在”。

因?yàn)榇髷?shù)據(jù),奧巴馬在2012年成為過去70年來,第一位在失業(yè)率高達(dá)7.4%的情況下成功連任的美國(guó)總統(tǒng);因?yàn)榇髷?shù)據(jù),Target超市“預(yù)測(cè)”了18歲少女的懷孕……

任何一項(xiàng)新技術(shù)的背后,都可能懸掛著一把達(dá)摩克利斯之劍。大數(shù)據(jù)也是如此,在人們驚嘆于它的“神力”之時(shí),“威脅”也正悄悄逼近。

“前兩年,國(guó)外一家情報(bào)搜集機(jī)構(gòu)利用國(guó)內(nèi)某機(jī)構(gòu)人員公開發(fā)表的數(shù)據(jù)和資訊,進(jìn)行深度挖掘分析,生成了有價(jià)值的情報(bào)。”徐曉蘭告訴記者,后來經(jīng)過詳細(xì)調(diào)查,確認(rèn)情報(bào)確實(shí)不是該人員提供,而生成情報(bào)的那些數(shù)據(jù)本身也是可公開的。“這在以往幾乎是不可能的,也給我們敲響了警鐘。”

尹卓以戰(zhàn)時(shí)的交通流量信息舉例說,如果不注重?cái)?shù)據(jù)的安全使用,將可能對(duì)國(guó)家安全帶來隱患。“科索沃戰(zhàn)爭(zhēng)中,南聯(lián)盟的油料庫雖然隱蔽得很好,但美國(guó)軍方通過對(duì)衛(wèi)星圖中的交通流量進(jìn)行分析,劃定了大量油罐車經(jīng)常出沒的區(qū)域,在進(jìn)行精確搜尋,從而一舉炸毀。”

如果您認(rèn)為這些“危險(xiǎn)因素”離自己很遠(yuǎn),那就大錯(cuò)特錯(cuò)。

“現(xiàn)在很多智能手機(jī)的應(yīng)用都要求訪問通訊錄,”鄔賀銓說,很多人覺得自己沒有什么秘密,就同意了。“但實(shí)際上,這不僅會(huì)透露自己的大量信息,也會(huì)把很多人置于隱私暴露的危險(xiǎn)之下 。”

張文浩也指出,現(xiàn)在很多年輕人都有用手機(jī)發(fā)微博或者“簽到”的習(xí)慣,“這樣其實(shí)會(huì)泄漏自己的很多信息。比如你白天經(jīng)常簽到的位置就很有可能是你的單位,傍晚以后簽的多半是自己家”。

大數(shù)據(jù)正經(jīng)歷成長(zhǎng)的煩惱

“要想征服數(shù)據(jù),只有更好地利用它們。”張文浩說,數(shù)據(jù)是一種資源和財(cái)富,積累越多,產(chǎn)生的效力也會(huì)越大。

這個(gè)觀點(diǎn)得到了鄔賀銓的認(rèn)同。他認(rèn)為,越想規(guī)避大數(shù)據(jù)帶來的安全風(fēng)險(xiǎn),越需要搜集儲(chǔ)存海量的數(shù)據(jù),并進(jìn)行深入的挖掘分析。“有統(tǒng)計(jì)顯示,國(guó)內(nèi)數(shù)據(jù)搜集量不及日本的60%和北美的7%,大量數(shù)據(jù)留這樣白白流逝。”

“企業(yè)掌握的數(shù)據(jù)畢竟有限,而且是局部的。”百度公司董事長(zhǎng)李彥宏委員提出了數(shù)據(jù)開放的概念,國(guó)家應(yīng)該把那些不涉及安全的數(shù)據(jù)公開,讓有能力的機(jī)構(gòu)進(jìn)行更好的分析利用。

國(guó)家基礎(chǔ)地理信息中心原總工程師李莉委員指出,有的公共部門掌握了大量公共信息,這些數(shù)據(jù)是國(guó)家基礎(chǔ)信息的重要組成部分。鄔賀銓強(qiáng)調(diào),這些數(shù)據(jù)“不愿與其他部門共享,導(dǎo)致了信息不完整或重復(fù)投資”。

共享數(shù)據(jù)在技術(shù)上是否存在很大的難度?在徐曉蘭看來,現(xiàn)在需要大力發(fā)展的數(shù)據(jù)挖掘、分析方面的技術(shù),但對(duì)于數(shù)據(jù)共享本身而言,技術(shù)不是最大的障礙,關(guān)鍵還是利益協(xié)調(diào)。她說幾年前,國(guó)土部和銀監(jiān)會(huì)準(zhǔn)備摸底國(guó)家土地信息,“一開始很多人提出各種各樣的困難,幾乎認(rèn)為是不可能完成的任務(wù)。但后來引入問責(zé)等行政手段,得到地方配合,進(jìn)行得就很順利”。

張文浩認(rèn)為,建立一個(gè)公開、透明、規(guī)范的數(shù)據(jù)市場(chǎng),將會(huì)大大增強(qiáng)數(shù)據(jù)的利用率。但在這個(gè)過程中,需要仔細(xì)考量什么樣的數(shù)據(jù)可以進(jìn)入市場(chǎng)。

這就涉及到立法的問題。“界定‘隱私’和為數(shù)據(jù)進(jìn)行安全分級(jí),是制定法律法規(guī)時(shí)要優(yōu)先考慮的方面。”他指出,“個(gè)性化服務(wù)和隱私之間是一個(gè)博弈。名字、電話、住址……不能什么都說是隱私,因此需要為數(shù)據(jù)安全分級(jí)。簡(jiǎn)單地說,通過數(shù)據(jù)分析的經(jīng)驗(yàn),我們會(huì)知道哪類信息具有更強(qiáng)的指向性和排他性。這類信息的安全級(jí)別就應(yīng)該更高。”

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)