Salesforce 用機(jī)器學(xué)習(xí)來自動總結(jié)文本,AI+SaaS 是未來嗎?

責(zé)任編輯:editor007

作者:夜葉

2017-05-15 21:16:18

摘自:36kr

如今我們身處海量信息時代,大量時間被用來處理電子郵件、文章或社交媒體的帖子等信息,有預(yù)計稱,這種消耗狀態(tài)會超過半天時間,甚至更多。

  

Salesforce 在變得更“聰明”的道路上又進(jìn)了一步。

如今我們身處海量信息時代,大量時間被用來處理電子郵件、文章或社交媒體的帖子等信息,有預(yù)計稱,這種消耗狀態(tài)會超過半天時間,甚至更多。

Salesforce 想將用戶從這種低效的工作狀態(tài)中解放,他們開發(fā)了種算法,能自動總結(jié)紛繁復(fù)雜的信息,如為銷售或客戶服務(wù)代表提供電子郵件和信息總結(jié)后的摘要,使他們有更多時間精力專注于自家客戶。

例如, Salesforce 的 AI 新產(chǎn)品 Einstein 會為那些全天候與電話打交道的客服代表,匹配最可能成為公司用戶的電話號碼。這飽含著 Salesforce 想把 CRM 系統(tǒng)變得更智能化的美好初衷。

這里用到了 Salesforce 在自然語言處理方面取得的兩項新突破:“情境語言生成模型( contextual word generation model )”及“新訓(xùn)練總結(jié)模型( new way of training summarization modelst )”,兩者一起就能自動為長文本創(chuàng)建較準(zhǔn)確可讀的摘要。

研究人員指出,自動文本摘要有兩種方式:提?。?extraction )或抽象( abstraction )。計算機(jī)能從文本預(yù)先有的措辭中提取,只是目前靈活度還有欠缺;抽象則是計算機(jī)在了解原文的基礎(chǔ)上,引入新詞概括原義。

這背后用到了機(jī)器學(xué)習(xí)技術(shù),深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)也在此發(fā)揮作用。研究者通過教師強(qiáng)迫( Teacher forcing)、強(qiáng)化學(xué)習(xí)( Reinforcement learning )來訓(xùn)練系統(tǒng)學(xué)習(xí)和改進(jìn)自身。

谷歌 DeepMind 就是強(qiáng)化學(xué)習(xí)典型案例。所謂強(qiáng)化學(xué)習(xí),簡單來說,就是訓(xùn)練機(jī)器能在采取某種行動后,通過結(jié)果的好壞,判定行動的好壞。如棋盤游戲,你能針對對手每步棋作出回應(yīng),最終你便能在一系列棋局中找到某步棋的最佳下法,并將此內(nèi)化成一種積極信號。運用到 Salesforce 將長文本處理成摘要的算法模型上,則有自動評估指標(biāo) ROUGE 對結(jié)果評分,算法將以更高得分來指導(dǎo)自身更新,最終輸出的摘要結(jié)果,會逐步提升。

教師強(qiáng)迫(Teacher forcing)是當(dāng)結(jié)果以既定參考的詞語得分時,能提供“很體面的結(jié)果”,但同時靈活性就得有所犧牲。

研究者們發(fā)現(xiàn),上述兩者聯(lián)合的模式優(yōu)于其他方法。 MIT Technology Review 對比人工總結(jié)和用 Salesforce 模型生成的摘要,他們稱后者具有“令人驚訝的準(zhǔn)確性”,總結(jié)不僅比原始文本短得多,重點內(nèi)容都有所概括,還兼具可讀性。

AI+SaaS 是未來?還是噱頭?

自動總結(jié)模型的背后,是 Salesforce 去年收購的深度學(xué)習(xí)創(chuàng)企 MetaMind,這還僅揭露了 Salesforce 人工智能版圖的冰山一角。

2015 年 Salesforce 加入人工智能的軍備競賽,彼時它收購了 iOS 平臺第三方智能日歷應(yīng)用 Tempo AI:通過 AI,Tempo 能自動為用戶安排任務(wù)和事項,儼然真人版助理;12 月,利用 AI 幫營銷人員開展廣告活動的公司 MinHash 被納入 Salesforce 版圖;去年除 MetaMind 外,Salesforce 還收購開源機(jī)器學(xué)習(xí)服務(wù)商 PredictionIO 。

擁有大量數(shù)據(jù)的公司作為發(fā)展人工智能底層架構(gòu),也是 Salesforce 緊盯的對象。Salesforce 收購了大數(shù)據(jù)公司 RelateIQ(3.9億美元),去年還想收購 Twitter ,更意圖用比微軟 262 億美元高的價格拿下領(lǐng)英,但未如愿以償。

微軟收購領(lǐng)英后,推出整合 CRM 和 ERP 云產(chǎn)品 Dynamics365,與微軟自身生態(tài) Office 365 及 Azure 云服務(wù)相協(xié)同。2016 年 Q2 季度,微軟取代 Salesforce 成為 SaaS 行業(yè)老大。CEO 納德拉還宣稱未來所有產(chǎn)品都將用到人工智能技術(shù),如 CRM Dynamics 365 就內(nèi)置 Cortana 人工智能套件。

巨頭們營造的大環(huán)境莫不如是:競爭激烈、發(fā)力人工智能尋求突破重圍。幾乎與 Salesforce 同段時間,甲骨文發(fā)力 AI ,推出自適應(yīng)智能應(yīng)用Adaptive Intelligent Apps)Adobe 為它旗下所有軟件提供基于深度學(xué)習(xí)和機(jī)器學(xué)習(xí)的底層技術(shù)平臺——Adobe Sensei;IBM 有 Waston;SAP 近期開始逐步發(fā)力機(jī)器學(xué)習(xí)和人工智能領(lǐng)域 ……

 

近期中美 SaaS 峰會上,北森 CEO 紀(jì)偉國提出,AI + 大數(shù)據(jù)是重構(gòu)下一代 HRSaaS 的力量,比如用AI 判斷面試官喜好,篩選簡歷,及從過去積累的人才庫里挖掘合適簡歷,預(yù)測人才離職傾向;AI 還能預(yù)測并推薦招聘渠道,企業(yè)知道把招聘發(fā)至哪個網(wǎng)站更合適, 預(yù)計收到多少份簡歷,現(xiàn)在競爭什么狀況等。

至此已有數(shù)十家廠商明確提出“AI+SaaS”,這里不排除有跟風(fēng)之嫌,只是當(dāng)行業(yè)趨向如此,對 SaaS 巨頭而言,是否做人工智能,或許意味著能否延續(xù)競爭優(yōu)勢,甚至是能否繼續(xù)參與巨頭們后期對話語權(quán)的爭奪。

但這是長期的遠(yuǎn)景。放置眼下,需要用到人工智能,數(shù)據(jù)作為前提條件的積累必不可少,這也是為何 CRM 相較其他 SaaS 應(yīng)用,對人工智能反應(yīng)更靈敏,畢竟在商務(wù)智能時代曾積累一定體量數(shù)據(jù)樣本,且標(biāo)準(zhǔn)化程度較高,數(shù)據(jù)為 AI 工具應(yīng)用提供存在合理性

峰瑞資本創(chuàng)始人李豐則干脆提出:先 SaaS ,再到大數(shù)據(jù),再到人工智能。“如果這個行業(yè)當(dāng)中的管理軟件或者叫線下數(shù)據(jù)的線上化還沒有完成,那第一步肯定先是SaaS,線下數(shù)據(jù)的線上化已經(jīng)比較普遍了之后,才輪到數(shù)據(jù)處理存儲這些事情,這些事情再往下堆迭,隨著產(chǎn)生時間越來越長,才到了處理數(shù)據(jù)的高效化,到了所謂人工智能。”

所以 AI 來了,創(chuàng)企有顆跟隨大潮及未來的趨勢心固然重要,但缺乏買買買的資金,難吸引高端技術(shù)人才的現(xiàn)實還是得認(rèn)清?;蛟S當(dāng)下的關(guān)鍵是做好本職,積累盡可能多的數(shù)據(jù),厚積薄發(fā)。

Salesforce 在變得更“聰明”的道路上又進(jìn)了一步。

如今我們身處海量信息時代,大量時間被用來處理電子郵件、文章或社交媒體的帖子等信息,有預(yù)計稱,這種消耗狀態(tài)會超過半天時間,甚至更多。

Salesforce 想將用戶從這種低效的工作狀態(tài)中解放,他們開發(fā)了種算法,能自動總結(jié)紛繁復(fù)雜的信息,如為銷售或客戶服務(wù)代表提供電子郵件和信息總結(jié)后的摘要,使他們有更多時間精力專注于自家客戶。

例如,Salesforce 的 AI 新產(chǎn)品 Einstein會為那些全天候與電話打交道的客服代表,匹配最可能成為公司用戶的電話號碼。這飽含著 Salesforce 想把 CRM 系統(tǒng)變得更智能化的美好初衷。

這里用到了 Salesforce 在自然語言處理方面取得的兩項新突破:“情境語言生成模型( contextual word generation model )”及“新訓(xùn)練總結(jié)模型(new way of training summarization modelst )”,兩者一起就能自動為長文本創(chuàng)建較準(zhǔn)確可讀的摘要。

研究人員指出,自動文本摘要有兩種方式:提?。?extraction )或抽象( abstraction )。計算機(jī)能從文本預(yù)先有的措辭中提取,只是目前靈活度還有欠缺;抽象則是計算機(jī)在了解原文的基礎(chǔ)上,引入新詞概括原義。

這背后用到了機(jī)器學(xué)習(xí)技術(shù),深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)也在此發(fā)揮作用。研究者通過教師強(qiáng)迫( Teacher forcing)、強(qiáng)化學(xué)習(xí)( Reinforcement learning )來訓(xùn)練系統(tǒng)學(xué)習(xí)和改進(jìn)自身。

谷歌 DeepMind 就是強(qiáng)化學(xué)習(xí)典型案例。所謂強(qiáng)化學(xué)習(xí),簡單來說,就是訓(xùn)練機(jī)器能在采取某種行動后,通過結(jié)果的好壞,判定行動的好壞。如棋盤游戲,你能針對對手每步棋作出回應(yīng),最終你便能在一系列棋局中找到某步棋的最佳下法,并將此內(nèi)化成一種積極信號。運用到 Salesforce 將長文本處理成摘要的算法模型上,則有自動評估指標(biāo) ROUGE 對結(jié)果評分,算法將以更高得分來指導(dǎo)自身更新,最終輸出的摘要結(jié)果,會逐步提升。

教師強(qiáng)迫(Teacher forcing)是當(dāng)結(jié)果以既定參考的詞語得分時,能提供“很體面的結(jié)果”,但同時靈活性就得有所犧牲。

研究者們發(fā)現(xiàn),上述兩者聯(lián)合的模式優(yōu)于其他方法。MIT Technology Review 對比人工總結(jié)和用 Salesforce 模型生成的摘要,他們稱后者具有“令人驚訝的準(zhǔn)確性”,總結(jié)不僅比原始文本短得多,重點內(nèi)容都有所概括,還兼具可讀性。

AI+SaaS 是未來?還是噱頭?

自動總結(jié)模型的背后,是Salesforce 去年收購的深度學(xué)習(xí)創(chuàng)企MetaMind,這還僅揭露了 Salesforce 人工智能版圖的冰山一角。

2015 年 Salesforce加入人工智能的軍備競賽,彼時它收購了iOS平臺第三方智能日歷應(yīng)用Tempo AI:通過 AI,Tempo 能自動為用戶安排任務(wù)和事項,儼然真人版助理;12 月,利用 AI 幫營銷人員開展廣告活動的公司 MinHash 被納入 Salesforce 版圖;去年除MetaMind 外,Salesforce 還收購開源機(jī)器學(xué)習(xí)服務(wù)商PredictionIO 。

擁有大量數(shù)據(jù)的公司作為發(fā)展人工智能底層架構(gòu),也是 Salesforce 緊盯的對象。Salesforce 收購了大數(shù)據(jù)公司 RelateIQ(3.9億美元),去年還想收購 Twitter ,更意圖用比微軟 262 億美元高的價格拿下領(lǐng)英,但未如愿以償。

微軟收購領(lǐng)英后,推出整合 CRM 和 ERP 云產(chǎn)品Dynamics365,與微軟自身生態(tài) Office 365 及 Azure 云服務(wù)相協(xié)同。2016 年 Q2 季度,微軟取代 Salesforce 成為 SaaS 行業(yè)老大。CEO 納德拉還宣稱未來所有產(chǎn)品都將用到人工智能技術(shù),如 CRM Dynamics 365 就內(nèi)置 Cortana 人工智能套件。

巨頭們營造的大環(huán)境莫不如是:競爭激烈、發(fā)力人工智能尋求突破重圍。幾乎與 Salesforce 同段時間,甲骨文發(fā)力 AI ,推出自適應(yīng)智能應(yīng)用Adaptive Intelligent Apps);Adobe 為它旗下所有軟件提供基于深度學(xué)習(xí)和機(jī)器學(xué)習(xí)的底層技術(shù)平臺——Adobe Sensei;IBM 有 Waston;SAP近期開始逐步發(fā)力機(jī)器學(xué)習(xí)和人工智能領(lǐng)域 ……

近期中美 SaaS 峰會上,北森 CEO 紀(jì)偉國提出,AI + 大數(shù)據(jù)是重構(gòu)下一代 HRSaaS 的力量,比如用AI 判斷面試官喜好,篩選簡歷,及從過去積累的人才庫里挖掘合適簡歷,預(yù)測人才離職傾向;AI 還能預(yù)測并推薦招聘渠道,企業(yè)知道把招聘發(fā)至哪個網(wǎng)站更合適, 預(yù)計收到多少份簡歷,現(xiàn)在競爭什么狀況等。

至此已有數(shù)十家廠商明確提出“AI+SaaS”,這里不排除有跟風(fēng)之嫌,只是當(dāng)行業(yè)趨向如此,對 SaaS 巨頭而言,是否做人工智能,或許意味著能否延續(xù)競爭優(yōu)勢,甚至是能否繼續(xù)參與巨頭們后期對話語權(quán)的爭奪。

但這是長期的遠(yuǎn)景。放置眼下,需要用到人工智能,數(shù)據(jù)作為前提條件的積累必不可少,這也是為何 CRM 相較其他 SaaS 應(yīng)用,對人工智能反應(yīng)更靈敏,畢竟在商務(wù)智能時代曾積累一定體量數(shù)據(jù)樣本,且標(biāo)準(zhǔn)化程度較高,數(shù)據(jù)為 AI 工具應(yīng)用提供存在合理性

峰瑞資本創(chuàng)始人李豐則干脆提出:先 SaaS ,再到大數(shù)據(jù),再到人工智能。“如果這個行業(yè)當(dāng)中的管理軟件或者叫線下數(shù)據(jù)的線上化還沒有完成,那第一步肯定先是SaaS,線下數(shù)據(jù)的線上化已經(jīng)比較普遍了之后,才輪到數(shù)據(jù)處理存儲這些事情,這些事情再往下堆迭,隨著產(chǎn)生時間越來越長,才到了處理數(shù)據(jù)的高效化,到了所謂人工智能。”

所以 AI 來了,創(chuàng)企有顆跟隨大潮及未來的趨勢心固然重要,但缺乏買買買的資金,難吸引高端技術(shù)人才的現(xiàn)實還是得認(rèn)清?;蛟S當(dāng)下的關(guān)鍵是做好本職,積累盡可能多的數(shù)據(jù),厚積薄發(fā)。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號