Google今天發(fā)布了一個(gè)全新的搜索功能——結(jié)構(gòu)化片段(Sturctured Snippets),能夠在搜索結(jié)果列表中展示從web網(wǎng)頁(yè)圖表中抓取的數(shù)據(jù)信息。
谷歌搜索引擎正在不斷通過(guò)其知識(shí)圖譜數(shù)據(jù)庫(kù)增加新的信息,最新增加的數(shù)據(jù)展示功能將出現(xiàn)在常規(guī)的文本搜索結(jié)果下方,例如搜索某尼康相機(jī)型號(hào)時(shí),返回的搜索結(jié)果中包含了該型號(hào)相機(jī)的在頁(yè)面圖表中包含的一些參數(shù)信息,例如CMOS像素、重量等。
目前Google正在通過(guò)機(jī)器學(xué)習(xí)技術(shù)區(qū)分哪些是包含有用信息的圖表(table),哪些是無(wú)效(例如網(wǎng)頁(yè)樣式設(shè)計(jì))的圖表,然后系統(tǒng)會(huì)根據(jù)相關(guān)度和質(zhì)量來(lái)決定顯示哪些信息。
據(jù)悉,Google的圖表數(shù)據(jù)抽取展示技術(shù)已經(jīng)應(yīng)用于Google Docs和Slides的研究工具中。