以下是現(xiàn)場速記。
UCloud優(yōu)刻得高級副總裁 陳曉建
陳曉建:大家下午好!我今天想用接下來的20分鐘時間,跟大家來談一談有關(guān)數(shù)據(jù)流通的事,為什么這個話題對行業(yè)來說是有價值的,我希望通過這20分鐘能講清楚。
我先介紹一下我們公司,我們公司是一個做云服務(wù)的公司,更準(zhǔn)確地講,我們是做一個IT的基礎(chǔ)架構(gòu)的公司。IT的基礎(chǔ)架構(gòu)最基本的就是云服務(wù),包括了網(wǎng)絡(luò)、計(jì)算、存儲,同時我們也做一些IoT、AI、大數(shù)據(jù)服務(wù),總體來講,我們希望為每個行業(yè)賦能,為他們提供底層的IT的能力,這是我們做的事。這個層面來講,我們做的事情還是挺多的,可以想象一下,既要提供網(wǎng)絡(luò),又要提供存儲,還要做IoT計(jì)算,這么多事情里面,我想數(shù)據(jù)流通是非常特殊的事,為什么這么說呢?大家可以看到,今天跟汽車行業(yè)相關(guān),我把跟行業(yè)相關(guān)現(xiàn)在目前的現(xiàn)狀歸納了四條。大家可以看到,2021年應(yīng)該是整個數(shù)據(jù)治理的元年,為什么這么說呢?國家相繼出臺了好多政策,6月1號《網(wǎng)絡(luò)安全法》開始實(shí)施,今年12月1號全國人大也會通過《個人信息保護(hù)法》,在汽車行業(yè)還有一個汽車行業(yè)相關(guān)的法律,《汽車數(shù)據(jù)安全管理?xiàng)l例》,10月1號也已經(jīng)實(shí)施了。在這個行業(yè)產(chǎn)生了這么多數(shù)據(jù),這些法律的制定為數(shù)據(jù)的應(yīng)用構(gòu)建了一個很好的框架。
有這些框架是不夠的,我們還需要這些數(shù)據(jù)應(yīng)該怎么去用?最顯著的一個問題,我想就是數(shù)據(jù)的分類分級,數(shù)據(jù)本身,產(chǎn)生了這么多數(shù)據(jù)之后,哪些是重要的,哪些是不重要的,需要我們做很多工作。新能源汽車到今天為止,應(yīng)該說有兩個關(guān)鍵詞,一個是新能源,包括像電力,混動,或者是氫能源。第二個詞也很重要,智能網(wǎng)聯(lián),車本身已經(jīng)不是傳統(tǒng)的代步工具,而是成為具備高度智能的產(chǎn)品,現(xiàn)在目前的新能源汽車很多都會有三千個,或者是五千個傳感器,每天在路上可以產(chǎn)生2TB-20TB的數(shù)據(jù),這么大量的數(shù)據(jù),數(shù)據(jù)處理方面需要非常復(fù)雜的IT系統(tǒng),從端到云,再到各個系統(tǒng)的互聯(lián),這里面有很多很多問題需要解決。
我簡單的用IT的術(shù)語解釋一下數(shù)據(jù)本身整個生命周期,車一方面是交通工具,另外一方面,也是一個IT產(chǎn)品,從IT產(chǎn)品來講,包括數(shù)據(jù)的采集、存儲、傳輸、使用和流通。如果從技術(shù)角度來講,前面四個環(huán)節(jié)目前都有一些成熟的技術(shù)可以用,唯獨(dú)最后一個環(huán)節(jié),數(shù)據(jù)流通,在現(xiàn)在目前來說還是處于非常早期的階段,這也是我希望今天能夠跟大家一起探討的問題。
為什么這么說呢?數(shù)據(jù)本身和實(shí)體商品是非常不一樣的,如果大家看一個實(shí)體商品,咱們面前一臺電視機(jī),如果我把這臺電視機(jī)賣給你,這臺電視機(jī)我就不擁有了,變成你擁有這臺電視機(jī)。但是數(shù)據(jù)有兩個特點(diǎn),決定是不能這樣流通的。第一,數(shù)據(jù)的復(fù)制是全息化的,復(fù)制的過程當(dāng)中不會損失一點(diǎn)信息,是可以100%復(fù)制過去的。第二,數(shù)據(jù)復(fù)制是極低成本的操作,由于這兩個特點(diǎn),如果我把數(shù)據(jù),作為一個數(shù)據(jù)賣給一個人,他可以轉(zhuǎn)手把這個數(shù)據(jù)原封不動賣給另外一個人,這樣導(dǎo)致的直接后果,就是從我自己來講,如果我想把這個數(shù)據(jù)變現(xiàn),最多只能賣給一個人或者是幾個人,因?yàn)閿?shù)據(jù)本身流傳出去就不受控制了。數(shù)據(jù)流通的方式,是不能按照傳統(tǒng)實(shí)體產(chǎn)品的流通方式來做的。
有一個比喻大家可能都聽說過,工業(yè)時代的石油是工業(yè)時代的血液,數(shù)據(jù)時代,在信息時代,什么才是血液呢?答案很簡單,就是數(shù)據(jù),怎樣讓數(shù)據(jù)能流通起來,這就是我們要解決的問題。任何一個企業(yè)來說,他的業(yè)務(wù)發(fā)展一定需要很多的數(shù)據(jù),有很多是自身的數(shù)據(jù),也需要其他各個合作伙伴的數(shù)據(jù),怎樣能做到數(shù)據(jù)的跨企業(yè),跨組織之間的流通,就是我們要解決的問題。
下面我舉一下目前數(shù)據(jù)流通常見的技術(shù),大家看到這些詞第一次看,不一定非常理解,只要看在中間這三個藍(lán)色的方框,沙箱、多方安全計(jì)算和同態(tài)加密,代表了目前所使用的技術(shù)的主流。要去講這個細(xì)節(jié),會需要很多的時間,肯定不是這20分鐘能夠覆蓋的。接下來我想用院士的話給大家做一些介紹。這是四位目前在一線的院士,他們也在整個數(shù)據(jù)的流通和隱私計(jì)算方面非常有研究,分別是在多方安全計(jì)算、沙箱和聯(lián)邦學(xué)習(xí)這方面做過非常深刻的研究。
第一位是姚期智院士,華裔里面第一個拿圖靈獎的院士,行業(yè)里面非常有名氣的,他在2000年提出一個很著名的問題,百萬富翁問題,其實(shí)就是隱私計(jì)算最簡化的例子,其實(shí)非常簡單,比如說假設(shè)有兩個百萬富翁,他們都很有錢,也知道對方很有錢,他們很想知道自己是不是比對方更有錢,這個例子雖然很簡單,但是幾乎是無解的,為什么?因?yàn)檎l也不會愿意把自己的財(cái)產(chǎn)具體數(shù)量告訴對方,你是很難做直接的比較,原因很簡單?因?yàn)槲也辉敢獍盐业脑紨?shù)據(jù)交出來。這個例子可以看到隱私計(jì)算,或者是多方安全計(jì)算要解決的問題是什么?要解決的問題就是在數(shù)據(jù)沒有發(fā)生實(shí)際泄露或者是分享的情況下,仍然能夠進(jìn)行協(xié)同的合作。
我再舉一個例子,跟百萬富翁問題很類似,比如說我們有兩個汽車的主機(jī)廠,他們都生產(chǎn)某一款商用車,他們每年的銷量都是非??捎^的,作為政府的行業(yè)機(jī)構(gòu),可能年底的時候,他要統(tǒng)計(jì)這款車,到底生產(chǎn)了多少輛。當(dāng)然這是一個假想的例子,假設(shè)對他們來說,這都是他們的商業(yè)機(jī)密,不愿意把這個車的生產(chǎn)的實(shí)際數(shù)字報給政府,但是他們政府也想知道,最后他們兩個廠商加起來能有多少輛車。這個問題其實(shí)是有解的,假設(shè)A廠商他的數(shù)量今年產(chǎn)了A輛車,B廠商今年產(chǎn)了B輛車,怎樣把A+B的操作做好,同時又能做到A和B不把自己原始的數(shù)字告訴政府。解決方式很簡單,就是在于我把A拆成兩個數(shù)字,A1和A2,B拆成B1和B2,把A1和B1兩個數(shù)字交給某一個中間商,A2和B2兩個數(shù)字交給另外一個中間商,他們把這個數(shù)字相加之后,再把中間的局部結(jié)果交給政府,政府做最后一個操作,把A1、A2、B1、B2全加起來就可以了。整個過程當(dāng)中,A的數(shù)值和B的數(shù)值都沒有泄露,最終完成了A+B的操作。通過這個例子大家可以看到,多方安全計(jì)算是干嘛的,他在保證原始數(shù)據(jù)不泄露的情況下,能夠讓多方數(shù)據(jù)來協(xié)同。
第二位是王懷民院士,他在業(yè)界提出了沙箱的概念,通過云的操作,讓用戶在沙箱里面接觸原始數(shù)據(jù),但是不把數(shù)據(jù)帶走,這是另外一個創(chuàng)新的概念。最后是聯(lián)邦學(xué)習(xí),聯(lián)邦學(xué)習(xí)通常是用于在AI的聯(lián)合建模里面的技術(shù)。
我今天想介紹通過這三個技術(shù)做的產(chǎn)品,這是我們公司所實(shí)現(xiàn)的產(chǎn)品,叫安全屋的安全流動平臺。我們在這個產(chǎn)品里面已經(jīng)實(shí)現(xiàn)了基于安全多方計(jì)算,沙箱,聯(lián)邦學(xué)習(xí),這三個能力所具備的產(chǎn)品。邏輯的角度來講,這個產(chǎn)品用來干嘛?其實(shí)可以分為四個角色,第一個角色當(dāng)然是右下角的數(shù)據(jù)源,套用前面開課吧劉總舉的例子,寧德時代需要開發(fā)一個電池的算法,不希望把這個原始數(shù)據(jù)拷貝給客戶或者是合作伙伴,但是他希望能夠通過這個數(shù)據(jù)開發(fā)一個算法,怎么辦呢?可以在他的生產(chǎn)環(huán)境里面架設(shè)一個開放平臺,數(shù)據(jù)放在開放平臺里面,在這個里面我們會有數(shù)據(jù)的需求方和增值服務(wù)方,他們在這個里面可以提供AI的能力,在這個里面,整個生產(chǎn)的安全環(huán)境里面使用這些數(shù)據(jù),但是他們不把這些數(shù)據(jù)帶走。這樣的話,最后的結(jié)果就是數(shù)據(jù)的所有權(quán)和使用權(quán)的分離。數(shù)據(jù)的所方,數(shù)據(jù)源把這個數(shù)據(jù)拿出來做分享,做開放,但是他的開放的結(jié)果只是把數(shù)據(jù)的使用權(quán)開放給了客戶,原始數(shù)據(jù)仍然不會造成泄露,通過這個可以滿足各方的需求。最后還有一個監(jiān)管方,通過監(jiān)管方對于整個數(shù)據(jù)的交易過程進(jìn)行監(jiān)管,保證數(shù)據(jù)是安全可靠使用的。
這是一個產(chǎn)品高度簡化的架構(gòu)圖,可以看到在這個里面,分為兩個方框,第一個是數(shù)據(jù)提供方,通常最左邊的方塊使用的是生產(chǎn)環(huán)境的數(shù)據(jù),在生產(chǎn)環(huán)境里面,通過對數(shù)據(jù)進(jìn)行各種處理之后,打標(biāo)簽,去重,脫敏等操作之后,把這個數(shù)據(jù)注入第二個方框里面,這個方框就是數(shù)據(jù)的安全開放的環(huán)境。大家可以理解成為,這個環(huán)境本身就是云的環(huán)境,因?yàn)樵骗h(huán)境里面用戶可以按照他自己的意愿,可以來自由地使用云環(huán)境,等于你可以在云的環(huán)境里面租幾臺服務(wù)器,把你的程序放進(jìn)去,可以建模,也可以搭游戲的平臺,可以做各種事情。在這個里面,他仍然是跟云的使用一樣的,所不同的是,這是一個安全加固的沙箱,這個環(huán)境里面雖然可以用,但是他是不能把這個數(shù)據(jù)從沙箱里面拷貝出去的。通過這個手段,我們就可以保證數(shù)據(jù)源本身對于數(shù)據(jù)安全的擔(dān)心。
最后通過計(jì)算之后,無論是AI的算法,可能最后是要把AI的算法結(jié)果帶走,其實(shí)他也不希望把這個原始數(shù)據(jù)帶走,但是希望帶走的是這個算法本身,有可能是對于某一些其他的操作,他可以把這個結(jié)果帶走。通過這樣的操作,既可以保證數(shù)據(jù)源的安全,也可以保證應(yīng)用方對于數(shù)據(jù)的使用。
這個其實(shí)是我們做的另外一個,為了能夠把這個產(chǎn)品化,需要去解決數(shù)據(jù)源對于數(shù)據(jù)使用的擔(dān)心。第一個,我剛剛提到的是數(shù)據(jù)本身,除了環(huán)境不能被使用方所帶走。第二個擔(dān)心同時存在的是,用戶是怎么去使用我這個數(shù)據(jù)的,這個對于數(shù)據(jù)源來說,通常也是非常擔(dān)心的問題。我們做到三點(diǎn),可控、可靠、可追溯,所做的工作就是右邊這個圖的中間這條線,是我們通過區(qū)塊鏈的手段,在整個安全屋操作里面,每個環(huán)節(jié)的步驟都記錄在鏈上。區(qū)塊鏈本身最大的特點(diǎn),他是不可篡改的,通過這樣的操作,可以讓數(shù)據(jù)源很清晰地知道整個數(shù)據(jù)的使用方是如何使用這些數(shù)據(jù)的,也做到了可控的能力,這個對于數(shù)據(jù)源來說是非常重要的。
數(shù)據(jù)流通的能力如果放在汽車的環(huán)節(jié)里面,因?yàn)槠嚸刻鞎a(chǎn)生非常非常多的數(shù)據(jù),當(dāng)然我們目前很多主機(jī)廠已經(jīng)把汽車的數(shù)據(jù)至少做到第一步,數(shù)據(jù)采集完之后,能夠傳輸?shù)胶笈_,能夠存儲起來。在這方面,一方面給主機(jī)廠本身所用,另外一方面,可以給整個行業(yè)產(chǎn)生很高的價值。舉一個簡單的例子,自動駕駛的算法優(yōu)化,如果把這些數(shù)據(jù)經(jīng)過脫敏之后提供給自動駕駛的算法廠商,通過數(shù)據(jù)可以優(yōu)化調(diào)試他的算法,這個一定會帶來好的結(jié)果。主機(jī)廠的下游來看,還會有車險,車的維修,充電樁的各種廠商,舉一個例子,通過車險如果他能夠了解車主本身的駕駛行為,也可以更好地判斷他的保險應(yīng)該多少錢,理賠的時候是不是有虛假理賠的情況發(fā)生。這一頁我們舉的例子只是我們能想到的,車產(chǎn)生的這些數(shù)據(jù)非常局部的場景,如果真的能讓數(shù)據(jù)安全流通起來,相信這個數(shù)據(jù)可以創(chuàng)造更大的價值。
下面我介紹兩個現(xiàn)在目前正在給主機(jī)廠做的實(shí)踐,第一個跟開課吧嘉賓所做的分享是非常類似的,也是電池管理的優(yōu)化。大家知道,在新能源車方面,電池其實(shí)是現(xiàn)在目前整個所有部件里面最重要的一個部件,在這個里面,也集成了非常多的傳感器,產(chǎn)生了非常大的數(shù)據(jù)。這些數(shù)據(jù)本身對于主機(jī)廠來說,可能自己也沒有一個專業(yè)能力完全去處理這些數(shù)據(jù),但是更好的方式,能夠把他跟電池的供應(yīng)商一起合作,把這些數(shù)據(jù)用起來。
我們所做的實(shí)踐,分為生產(chǎn)環(huán)境和流通環(huán)境,生產(chǎn)環(huán)境里面,這些數(shù)據(jù)從車本身上傳到后臺之后,經(jīng)過一些去重處理之后,放在流通環(huán)境里面,整個環(huán)節(jié)是一個單向的環(huán)節(jié),流通環(huán)節(jié)是不會影響到生產(chǎn)環(huán)節(jié)里面的,每天會把這個數(shù)據(jù)定期從生產(chǎn)環(huán)節(jié)復(fù)制到流通環(huán)節(jié),流通環(huán)節(jié)里面搭建了基于計(jì)算沙箱和大數(shù)據(jù)的平臺,用戶可以跑在這個平臺里面,可以把他自己的算法,把他自己的數(shù)據(jù)放在這個沙箱里面,結(jié)合主機(jī)廠所提供的這些電池的數(shù)據(jù),一起進(jìn)行他自己的電池算法的優(yōu)化,或者說做一些運(yùn)營,運(yùn)維的工作。他自己得到結(jié)果之后,再經(jīng)過數(shù)據(jù)源的審核通過之后,可以把這個數(shù)據(jù)做一個輸出,所以整個過程當(dāng)中都是不會涉及到原始數(shù)據(jù)本身泄露的。
第二個工作,我們目前跟另外一個廠商做的UBI的工作,其實(shí)是基于個人來做的定制化的保險服務(wù),這個服務(wù)本身并不是新名詞,在海外,比如說在美國,UBI早就已經(jīng)超過了10%的份額,這個服務(wù)所依賴的,很明顯,需要大量的業(yè)務(wù)數(shù)據(jù),包括個人數(shù)據(jù),包括行車數(shù)據(jù)等等。在這方面,我們同樣通過安全屋這個平臺,把個人的這些行車數(shù)據(jù),通過脫敏之后,放在車險的平臺里面,這個環(huán)境仍然是在車的自身的環(huán)境里面,保險公司可以把他自己的這些算法,在整個開放的平臺里面去跑,能夠獲得有關(guān)于車主的信息。通過這個,能夠?yàn)樗嚨耐侗:屠碣r服務(wù),提供很好的參考。
在這個里面我們還做了一件事情,整個平臺當(dāng)中,不光是有車廠本身的數(shù)據(jù),另外也整合了包括像其他第三方的數(shù)據(jù),因?yàn)閷τ谲嚻蠛捅kU公司來說,需要的不光是行車的數(shù)據(jù),也需要其他的跟個人相關(guān)的數(shù)據(jù)。所有這些數(shù)據(jù)的開放和分享,都是要基于個人數(shù)據(jù)的保護(hù)的前提下來做的,我們也做了很多,怎樣取得個人用戶的授權(quán),并且把這些授權(quán)記錄在區(qū)塊鏈里面,作為日志,來保證數(shù)據(jù)本身的授權(quán)是合規(guī)的,這樣來保證數(shù)據(jù)的安全使用。這些就是我們現(xiàn)在做的工作。
我再介紹一下我們公司,我們公司是一家科創(chuàng)板上市的云企業(yè),也是在這個行業(yè)里面做了七八年的時間,我們的客戶最開始的時候是互聯(lián)網(wǎng)客戶,現(xiàn)在有非常多的傳統(tǒng)企業(yè),政府,都是我們的客戶,包括我們的產(chǎn)品安全屋,最開始服務(wù)的行業(yè)是政府行業(yè),因?yàn)榇蠹铱梢钥吹?,像網(wǎng)絡(luò)安全法,在今年的網(wǎng)絡(luò)安全法,其實(shí)已經(jīng)很明確地提到促進(jìn)政務(wù)數(shù)據(jù)的開放,政務(wù)數(shù)據(jù)本身的開放和流通,是我們最開始在2017年的時候,跟各級政府都已經(jīng)有了很多的合作,也是誕生了一些案例。
我們也在全球有非常多的服務(wù)中心,包括在國內(nèi),包括在東南亞,還包括像北美、南美、歐洲,甚至在非洲都有我們自己的數(shù)據(jù)中心。我們主要的客戶,其實(shí)也是中國進(jìn)行海外業(yè)務(wù)拓展的公司。
這是我們的產(chǎn)品,時間所限,我就不一一展開了,我們是基于云服務(wù)、大數(shù)據(jù)、AI、IoT做的產(chǎn)品,這些是通用的能力,是根據(jù)不同的行業(yè)做一些行業(yè)定制化解決方案。
最后一頁是我們所設(shè)想的,基于汽車的行業(yè),包括目前跟車廠的合作實(shí)踐,我們看到藍(lán)色的這些方塊,是我們目前可以為這個行業(yè)賦能的。第一個,當(dāng)然是底下云的能力,包括私有云的能力,另外一個是大數(shù)據(jù)的能力,這些是跟業(yè)務(wù)非常緊密耦合的,另外還有數(shù)據(jù)的存儲,還有跟公有云之間的打通,最后是我前面介紹的安全屋,怎樣幫助企業(yè)能夠把整個產(chǎn)業(yè)鏈,從上游到下游,跟各個合作伙伴之間,把業(yè)務(wù)數(shù)據(jù)流通起來,為他的業(yè)務(wù)助力。這些是從我們目前看到的,和這個行業(yè)能發(fā)生合作的機(jī)會點(diǎn),隨著我們的認(rèn)識逐漸提升,可以做的事情還會很多。
這就是我今天的分享,數(shù)據(jù)流通的行業(yè)其實(shí)是非常新的話題,相信未來還有很多的工作需要做,今天來的都是汽車行業(yè)的大拿,如果有興趣的話,可以借助這個微信群一起交流,謝謝大家!