記者從香港中文大學(xué)深圳研究院日前主辦的“富媒體大數(shù)據(jù):感知、處理、檢索及應(yīng)用”博文論壇(第二期)了解到,如何對(duì)富媒體大數(shù)據(jù)進(jìn)行有效挖掘成為大數(shù)據(jù)領(lǐng)域的研究熱點(diǎn),對(duì)數(shù)據(jù)進(jìn)行精確建模、設(shè)計(jì)高效算法、構(gòu)建核心技術(shù),從而實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)運(yùn)營(yíng),是目前產(chǎn)業(yè)界和學(xué)術(shù)界正在探索和研究的主要方向之一。
“21世紀(jì)的‘數(shù)據(jù)’相當(dāng)于20世紀(jì)的‘石油’。”據(jù)香港中文大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)系教授、國(guó)際電機(jī)及電子工程師學(xué)會(huì)院士呂榮聰介紹,不同于傳統(tǒng)的多媒體數(shù)據(jù),富媒體大數(shù)據(jù)因聚合了多種媒體數(shù)據(jù)的動(dòng)態(tài)性與交互性,包含了更多的信息與價(jià)值。大數(shù)據(jù)具有四個(gè)非常典型的特點(diǎn)4V,即規(guī)模急劇膨脹(Volume)、來源多種多樣(Variety)、變化快速瞬息(Velocity)、關(guān)系錯(cuò)綜復(fù)雜(Veracity)。
今年7月,香港中文大學(xué)深圳研究院的深圳富媒體大數(shù)據(jù)分析與應(yīng)用重點(diǎn)實(shí)驗(yàn)室項(xiàng)目獲批。該實(shí)驗(yàn)室以富媒體大數(shù)據(jù)計(jì)算平臺(tái)為基礎(chǔ),以智能計(jì)算技術(shù)為核心,結(jié)合互聯(lián)網(wǎng)及多媒體相關(guān)應(yīng)用發(fā)展關(guān)鍵技術(shù),已積累了大量豐富的研究成果,并成功用于互聯(lián)網(wǎng)和教育等產(chǎn)業(yè)。
香港中文大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)系教授、深圳富媒體大數(shù)據(jù)分析與應(yīng)用重點(diǎn)實(shí)驗(yàn)室主任金國(guó)慶告訴記者,比如通過社交網(wǎng)絡(luò)的分析可以進(jìn)行意見挖掘、感情分析,可以用分析工具獲知哪些人在推廣某些產(chǎn)品上更加有效,可以通過對(duì)企業(yè)負(fù)責(zé)人公開的社交網(wǎng)絡(luò)信息挖掘出一定的社會(huì)關(guān)系鏈,比如通過對(duì)文本相似度的分析,可以快速找出有抄襲嫌疑的文章,最終由人來決定一篇文章是否抄襲。
金國(guó)慶表示,目前這一檢測(cè)文件相似度的系統(tǒng)及方法已在香港、臺(tái)灣、新加坡等地申請(qǐng)了5項(xiàng)專利,已經(jīng)在香港政府與香港高校等較為廣泛的范圍內(nèi)使用,希望通過深圳的平臺(tái)做更多的推廣,推動(dòng)該產(chǎn)品在內(nèi)地更大范圍內(nèi)使用。
據(jù)介紹,深圳市富媒體大數(shù)據(jù)分析與應(yīng)用重點(diǎn)實(shí)驗(yàn)室不僅將繼續(xù)在富媒體大數(shù)據(jù)方面產(chǎn)出理論成果、分析工具、產(chǎn)品應(yīng)用等,而且將依托深圳這一產(chǎn)業(yè)型取向的城市在大數(shù)據(jù)產(chǎn)業(yè)化方面的優(yōu)勢(shì),將更多研究成果向內(nèi)地推廣應(yīng)用。