Pinterest 看到了未來,它會(huì)成為圖像搜索領(lǐng)域的谷歌嗎?

責(zé)任編輯:editor004

作者:chiming

2017-12-18 11:25:48

摘自:36kr

Pinterest的受歡迎程度在于,它能夠?yàn)槊恳晃挥脩魟?chuàng)建一個(gè)獨(dú)特的“品味圖譜”,從而推斷出其可能感興趣的其他東西。2016年,該公司在視覺人工智能領(lǐng)域進(jìn)行了早期投資,并在谷歌上招募了計(jì)算機(jī)視覺專家Li Fan。

編者按:隨著圖像識(shí)別技術(shù)的不斷發(fā)展,視覺搜索也愈加被人所重視,它會(huì)造就下一個(gè)谷歌嗎?近日,FastCodesign發(fā)布了一篇文章,介紹了該領(lǐng)域Pinterest近年來的發(fā)展?fàn)顩r及其背后的潛力與野心。作者為MARK WILSON,文章由36氪編譯。

Pinterest 看到了未來,它會(huì)成為圖像搜索領(lǐng)域的谷歌嗎?

一、

這一切都從16個(gè)月前一個(gè)牛油果開始的。

在Pinterest位于舊金山的總部,一個(gè)特殊的牛油果被放置在會(huì)議室的桌子上。Pinterest的創(chuàng)意總監(jiān)Albert Pereta被六名同事簇?fù)碇?,走近水果,小心翼翼地用手機(jī)瞄準(zhǔn)拍攝。他正在測(cè)試該公司的最新發(fā)明,這是一項(xiàng)名為“Lens”的功能。如果測(cè)試正確,它不僅能識(shí)別出這種水果,還能搜索過去7年里上傳至該服務(wù)的數(shù)十億張照片,以尋找類似的圖片。

Pereta拍下照片后,應(yīng)用花了一會(huì)兒時(shí)間與云同步,然后把結(jié)果反饋出來。Pereta的手機(jī)屏幕上充滿了看似無窮無盡的、從各個(gè)角度拍攝的牛油果。

“很多人都很驚嘆,說‘這東西真好!’”Pereta說道。Pinterest已經(jīng)能夠通過視覺線索識(shí)別出了一個(gè)物體,這是一個(gè)非常困難的工程問題。但Pereta并不滿意:“當(dāng)我看著這個(gè)結(jié)果的時(shí)候,我在想,‘誰在乎呢?’”

視覺搜索技術(shù)的效果非常好,但其結(jié)果毫無意義。沒有人會(huì)拍下牛油果的照片,希望能得到一幅幾乎完全相同的牛油果照片,更不用說無窮無盡的照片了。“我們開始問,‘如果你給一個(gè)牛油果拍照,你想要什么?’”Pereta回憶道。有人說他想要一份食譜。“所以你甚至不會(huì)看到牛油果,你會(huì)看到一些粘乎乎的牛油果醬,”Pereta說?;蛘逷interest可以提供關(guān)于如何種植牛油果的信息,或者你可以用牛油果做些什么。“那太不可思議了,”Pereta回憶說。

如今,牛油果的故事已經(jīng)成為了一個(gè)寓言,安放在Pinterest總部的膠合板墻內(nèi)。這提醒人們,個(gè)性化比完美更有價(jià)值。隨著該公司在去年2月推出Lens Beta版測(cè)試工具,深入到新興的視覺搜索領(lǐng)域時(shí),這一點(diǎn)尤為明顯——這個(gè)版本并沒有調(diào)用成千上萬的牛油果圖片。結(jié)合Pereta的見解,這款應(yīng)用能夠提供與它們相關(guān)的想法,比如,制作牛油果醬。這是一個(gè)早期的視角,即Pinterest在非?,F(xiàn)實(shí)的情況下,如何將希望寄托在視覺人工智能上,從而徹底改變?nèi)藗冑?gòu)物和飲食方式的一切行為。

二、

在過去的二十年里,我們通過在搜索欄中輸入信息來尋找網(wǎng)絡(luò)上的東西。由于機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,計(jì)算機(jī)視覺即將讓我們通過拍照來進(jìn)行搜索。谷歌、Facebook、微軟和亞馬遜都在向這項(xiàng)技術(shù)投入大量資源。這也就不足為奇了:谷歌將在2017年通過傳統(tǒng)文本搜索廣告獲得約286億美元的收入。使用Alexa、Siri和Google Assistant等服務(wù)的語音搜索功能,現(xiàn)在才剛剛實(shí)現(xiàn)。視覺搜索呢?這可能是一件具有里程碑意義的事情,因?yàn)樵S多技術(shù)專家都設(shè)想未來的智能手機(jī)不會(huì)出現(xiàn)在我們的口袋里,而是在我們的眼睛里。

Pinterest首席執(zhí)行官Ben Silbermann表示:“我真的認(rèn)為,攝像頭將成為下一個(gè)鍵盤。它將成為你用來查詢周圍世界、發(fā)現(xiàn)身邊事物、或想象某個(gè)東西可能適合你生活的一個(gè)基本工具。

在這個(gè)競(jìng)爭(zhēng)激烈的領(lǐng)域,Pinterest看起來并不算什么。但其在那堆牛油果下隱藏了很多東西。當(dāng)各種黨派之爭(zhēng)的內(nèi)容占據(jù)了許多應(yīng)用和網(wǎng)站的時(shí)候,Pinterest的2億月活躍用戶就會(huì)轉(zhuǎn)向該服務(wù),從而尋求一種更美好的生活,比如更舒適的客廳、冒險(xiǎn)的旅行,或者健康的零食。根據(jù)尼爾森的一項(xiàng)研究,他們不是在尋找美食照片,也不一些能夠發(fā)到Instagram上的照片,而是他們可以真正烹飪的日常食物:98%的Pinterest用戶表示他們會(huì)嘗試在該服務(wù)中發(fā)現(xiàn)的新東西。廣告商們也開始接受這個(gè)網(wǎng)站。從2015年到2017年,Pinterest的年?duì)I收預(yù)計(jì)將增長(zhǎng)5倍,達(dá)到5億美元,而其在全球范圍內(nèi)的用戶增長(zhǎng)將達(dá)到40%。(Pinterest拒絕就營(yíng)收增長(zhǎng)和預(yù)測(cè)發(fā)表評(píng)論。)

Pinterest 看到了未來,它會(huì)成為圖像搜索領(lǐng)域的谷歌嗎?

Ben Silbermann。

Pinterest的受歡迎程度在于,它能夠?yàn)槊恳晃挥脩魟?chuàng)建一個(gè)獨(dú)特的“品味圖譜”,從而推斷出其可能感興趣的其他東西。現(xiàn)在,Pinterest正致力于將計(jì)算機(jī)視覺技術(shù)融入到對(duì)用戶偏好的深入理解中。“所有的東西都在不斷涌現(xiàn),這是Pinterest在為你的實(shí)際生活尋找創(chuàng)意時(shí)的有用之處,”Silbermann說。“如果人們真的用Pinterest來決定他們?cè)诩依镒龅乃惺虑?,比如他們?zhǔn)備烹飪的食物,或者是他們的下一個(gè)假期等等,那就會(huì)有巨大的價(jià)值。”這意味著Pinterest不僅需要像谷歌一樣掌握你正在尋找的東西,還必須預(yù)測(cè)你永遠(yuǎn)不知道的,但你想要的東西。如果這家公司取得成功,它可以利用我們的相機(jī)開啟一個(gè)無窮無盡的個(gè)人發(fā)現(xiàn)世界。Pinterest聯(lián)合創(chuàng)始人Evan Sharp表示:“視覺搜索能產(chǎn)生的持久影響不會(huì)是什么特定的產(chǎn)品或功能,而是它讓人們能夠做的事情:將人們看到的任何東西,變成可以用來在互聯(lián)網(wǎng)上發(fā)現(xiàn)更多東西的東西。”

三、

我站在舊金山SOMA社區(qū)的一間花園公寓里拿出了Pinterest應(yīng)用。即便是在地下室的照明設(shè)備中,鏡頭也能很好地工作,將我拍攝的物體與其突出的特征匹配起來。鏡頭不僅能看到一把椅子,還能看到是一把俱樂部的椅子。不僅僅是一個(gè)枕頭,還是一個(gè)kilim枕頭。不僅僅是“藝術(shù)”品,還是一幅Rothko的畫作。通過這個(gè)過程,我實(shí)際上學(xué)到了許多東西。許多識(shí)別結(jié)果伴隨著的都有可操作的鏈接,我可以用它來標(biāo)記、甚至購(gòu)買。

后來,我嘗試通過Google Lens拍攝類似的照片,這是Pinterest的一個(gè)競(jìng)爭(zhēng)對(duì)手,在今年早些時(shí)候在Pixel手機(jī)上推出了測(cè)試版。谷歌的版本不知道它看到了一把椅子,甚至是家具,并向我道歉。它甚至誤把枕頭當(dāng)作被子。它唯一能與之匹配的是Rothko的作品,不過值得注意的是,人們普遍認(rèn)為,識(shí)別2D藝術(shù)品是視覺搜索工具最簡(jiǎn)單的挑戰(zhàn)之一。

Google Lens不是很好。至少現(xiàn)在還沒有很好。但你可以看到,視覺AI是如何與公司的更大的業(yè)務(wù)需求以及其他科技巨頭相結(jié)合的。谷歌的業(yè)務(wù)是建立索引,因此該公司希望幫助用戶直觀地識(shí)別周圍的世界,這是有道理的。Facebook有自己的社交圖譜,專注于將用戶與朋友聯(lián)系起來,以及利用人工智能識(shí)別人臉的既得利益。亞馬遜擁有電子商務(wù)。對(duì)它來說,視覺搜索可以成為數(shù)字世界和現(xiàn)實(shí)世界之間的橋梁——例如,你拍攝一雙鞋,在亞馬遜上尋找類似的,也許是更便宜的。每家公司可能會(huì)以不同的方式對(duì)待視覺人工智能,但其含義是一樣的:在這個(gè)新興領(lǐng)域,即使現(xiàn)在還不能清楚地表達(dá)出它的價(jià)值,也會(huì)有一些資金在涌入這個(gè)新興領(lǐng)域。Forrester的搜索分析師Collin Colburn說:“想想看,你有可能會(huì)拍一張照片,去尋找你甚至無法描述的東西。這是非常強(qiáng)大的東西。這可能是最不成熟的搜索,但它可能最有潛力。”

谷歌有數(shù)百名員工獨(dú)立從事視覺人工智能的開發(fā)工作。Facebook擁有2萬名員工和300名人工智能研究人員,此外它還在社交網(wǎng)絡(luò)上進(jìn)行120萬個(gè)視覺人工智能實(shí)驗(yàn)。亞馬遜擁有超過50萬名員工,其中有5000名員工在Alexa上工作——它的新Echo Show不僅有麥克風(fēng),還配備了與Alexa互動(dòng)的攝像頭——可以讓亞馬遜看到你的整個(gè)房間。Pinterest?該公司只有12名員工致力于視覺搜索。

但Pinterest比看起來更強(qiáng)大。首先,它擁有大量數(shù)據(jù)來訓(xùn)練視覺人工智能。你擁有的圖像越多,算法就會(huì)越智能,而且它在提供用戶真正想要的推薦時(shí)也會(huì)變得更好。許多研究人員使用的最大公共數(shù)據(jù)集——Image Net,包括1400萬個(gè)日常物品的眾包照片網(wǎng)站。Pinterest擁有數(shù)十億張照片——由熱心的Pinner從博客上瀏覽上傳,或者是由公司自己發(fā)布——大部分都有完美的舞臺(tái)和燈光效果,因?yàn)樗鼈兪枪俜降漠a(chǎn)品攝影。電腦能更容易地看到完美的圖像。同樣重要的是:這些照片已經(jīng)被Pinterest的忠實(shí)用戶親手標(biāo)記并貼上標(biāo)簽。

卡內(nèi)基梅隆大學(xué)機(jī)器學(xué)習(xí)主管Manuela Veloso表示:“數(shù)據(jù)集越大,你感到驚訝的可能性就不會(huì)越大。Pinterest的數(shù)十億數(shù)據(jù)的有趣之處在于,它們將會(huì)覆蓋各種極端案例。”

此外,Pinterest的設(shè)計(jì)也會(huì)在用戶搜索時(shí)提供一些模糊的結(jié)果。這是Pinterest從牛油果學(xué)到的經(jīng)驗(yàn)。精確匹配是谷歌搜索的特色,它已經(jīng)針對(duì)特定問題進(jìn)行了優(yōu)化,比如“你如何烤魚?”后面將會(huì)有一個(gè)完美的鏈接。Pinterest的用戶往往會(huì)提出更含糊的問題:他們每周可能會(huì)搜索幾次“海鮮晚餐創(chuàng)意”。對(duì)他們來說,不精確的答案并不是錯(cuò)誤。而是靈感。

換句話說,Pinterest的人工智能在視覺搜索方面可能會(huì)失敗,但幸運(yùn)的是能找到正確答案。想象一下,Siri會(huì)做同樣的事情。“在其他一些公司,我們談到了精確的召回。但說到底,用戶對(duì)功能的感覺是非常有用的,”Pinterest的工程主管Li Fan表示。他們可能不需要100%的精確度。沒關(guān)系。只要我們實(shí)現(xiàn)了預(yù)期,他們就會(huì)覺得這是一種持續(xù)的體驗(yàn),他們覺得這很有用。

Pinterest 看到了未來,它會(huì)成為圖像搜索領(lǐng)域的谷歌嗎?

Li Fan。

在競(jìng)爭(zhēng)平臺(tái)因侵犯隱私而受到攻擊的時(shí)候,Pinterest也已經(jīng)贏得了用戶的信任。人們把Pinterest看作是搜索引擎或社交網(wǎng)絡(luò)之外的東西。Silbermann說:“我們?cè)噲D與用戶建立的關(guān)系是,當(dāng)你分享自己的事情時(shí),是基于你想要更好的推薦,我們會(huì)為你提供你想要的內(nèi)容。”這一預(yù)期相當(dāng)明確。你用Pinterest來尋找一個(gè)時(shí)尚風(fēng)格,所以如果我們問你:“你最喜歡的顏色是什么?”這一點(diǎn)沒有任何侵犯性。”這樣的互動(dòng)讓Pinterest能夠提供既出人意料又準(zhǔn)確的結(jié)果。它的設(shè)計(jì)語言更像是精心挑選的而不是經(jīng)過精心策劃的,而且也比機(jī)器人更人性化。

四、

Pinterest成立于2010年,主要是在設(shè)計(jì)上花費(fèi)了巨大投資:它可以讓用戶收集和整理感興趣的主題,而不是難看的藍(lán)色文字鏈接,而是虛擬索引卡上的華麗照片。聯(lián)合創(chuàng)始人Sharp是一位具有創(chuàng)造性而且有遠(yuǎn)見的人,他曾在哥倫比亞大學(xué)的研究生建筑學(xué)院接受過培訓(xùn),是首席執(zhí)行官Silbermann的完美補(bǔ)充——他是一名管理顧問,后來成為了企業(yè)家。該平臺(tái)非常受歡迎:2012年,comScore分析公司宣布它是歷史上增長(zhǎng)最快的Web服務(wù)。

Pinterest的照片卡采用了一種新穎的設(shè)計(jì)方式,比如谷歌等巨頭,從搜索結(jié)果到Android操作系統(tǒng),都在使用它們。不過,自那以后,它的飛速增長(zhǎng)已經(jīng)放緩。如今,光芒已經(jīng)被Instagram的8億月活躍用戶和使用激進(jìn)AR技術(shù)的Snapchat所掩蓋。

不過,Pinterest并未追求激進(jìn)的增長(zhǎng),而是在其核心產(chǎn)品上加倍投資:預(yù)測(cè)用戶想看什么。“我們最終在機(jī)器學(xué)習(xí)上投入了大量資金,”Sharp說,他現(xiàn)在是公司的首席產(chǎn)品官。“大部分用戶看到的內(nèi)容都是通過算法來決定的,”他說。“這是一個(gè)推薦,一個(gè)搜索結(jié)果,或者一個(gè)Related Pin。”

Pinterest 看到了未來,它會(huì)成為圖像搜索領(lǐng)域的谷歌嗎?

Evan Sharp。

后一項(xiàng)功能是在2013年發(fā)布的,它能根據(jù)你看過的內(nèi)容生成一個(gè)相對(duì)簡(jiǎn)單的推薦Pin列表。到2014年,公司才委派了一些人工智能工程師,讓它變得更好。他們通過訓(xùn)練算法來推薦相關(guān)的話題,并根據(jù)視覺線索推薦類似的項(xiàng)目,優(yōu)先選擇能獲得最多點(diǎn)擊量的Pin。如果你點(diǎn)擊一個(gè)由倒放的樹枝做成的衣架,Related Pins中會(huì)包括一份韋恩(Venn)圖,里面包含了一些合理的建議,包括房屋裝飾和木質(zhì)裝潢,包括樹干上的衣架、小房間的分隔物,以及一個(gè)回收的谷倉(cāng)木鑰匙托盤。今天,Related Pins占據(jù)了Pinterest所有互動(dòng)中的40%。

2016年,該公司在視覺人工智能領(lǐng)域進(jìn)行了早期投資,并在谷歌上招募了計(jì)算機(jī)視覺專家Li Fan。她在谷歌工作了8年,之后在百度工作,領(lǐng)導(dǎo)了1000名工程師。然后她又回到谷歌,選擇了一個(gè)更加專注的角色,擔(dān)任谷歌圖片搜索的負(fù)責(zé)人。最后,Pinterest找上門來。“作為領(lǐng)導(dǎo)者和個(gè)人,Li Fan的價(jià)值觀與Pinterest的價(jià)值觀非常契合,”Silbermann說。“有一件事讓我產(chǎn)生了共鳴,那就是她認(rèn)為科技是一種豐富人們生活的方式,而不是單單的技術(shù)。”

在Li Fan的領(lǐng)導(dǎo)下,Pinterest在Lens、Pins和公司的瀏覽器擴(kuò)展工具上進(jìn)行的視覺搜索同比增長(zhǎng)了近70%,每月的搜索量超過3億次。與此同時(shí),Pinterest的商業(yè)合作伙伴已經(jīng)看到了他們的 “Shop the Look”Pins點(diǎn)擊量背后巨大的潛力——這一功能可以讓用戶點(diǎn)擊,然后購(gòu)買圖片中的商品。

所有這些都匯聚成一個(gè)豐富的商業(yè)機(jī)會(huì)。FirstMark Capital的風(fēng)險(xiǎn)投資人Rick Heitzmann表示:“最初,Pinterest是由用戶類別進(jìn)行管理的。”他曾在2009年對(duì)Pinterest的聯(lián)合創(chuàng)始人進(jìn)行了第一次調(diào)查,并參與了此后的每一輪投資。“但隨著科技的發(fā)展,它是由人工智能、圖像識(shí)別,以及找到你喜愛和關(guān)心的東西所驅(qū)動(dòng)的。”Pinterest的使命是將視覺搜索變成一項(xiàng)內(nèi)容,而Heitzmann對(duì)這些機(jī)會(huì)感到非常興奮。“你可以看到潛在的市場(chǎng)規(guī)模很大。”

Pinterest已經(jīng)向廣告商提供了一個(gè)吸引注意力的平臺(tái)。根據(jù)一項(xiàng)調(diào)查顯示,93%的用戶使用Pinterest來制定購(gòu)物計(jì)劃,87%的人通過Pinterest購(gòu)買了一些東西。但至關(guān)重要的是,Pinner還沒有確定他們想要的確切產(chǎn)品。根據(jù)Pinterest的數(shù)據(jù),97%的搜索請(qǐng)求沒有一個(gè)特定的品牌。與此同時(shí),視覺搜索工具讓這個(gè)品牌發(fā)現(xiàn)過程更加誘人,尤其是當(dāng)搜索結(jié)果與用戶的個(gè)人“口味圖譜”相關(guān)聯(lián)的時(shí)候。

Target最近成為了Pinterest的Lens技術(shù)的獨(dú)家美國(guó)零售合作伙伴。很快,在該零售商的主應(yīng)用內(nèi),你將可以使用集成版的Lens,比如說,拍攝一盞臺(tái)燈,并看到由Target銷售的視覺效果相似的產(chǎn)品。“我們的客人在每一種購(gòu)物體驗(yàn)中都渴望舒適和方便。”視覺搜索是一個(gè)巨大的解鎖工具,因?yàn)樗水a(chǎn)品搜索中的很多障礙,”Target的CMO Rick Gomez說。“通過簡(jiǎn)單地拍下一件感興趣的商品,Pinterest的鏡頭將會(huì)返回那些專門針對(duì)我們的客戶所尋找的產(chǎn)品。”(Walmart、American Eagle和Tommy Hilfiger在他們的應(yīng)用上也有視覺搜索功能,這是由初創(chuàng)公司Slyce創(chuàng)建的。)Pinterest還與三星合作,為Galaxy智能手機(jī)提供視覺搜索功能,并與Shopstyle合作,將Lens的結(jié)果與500萬多種時(shí)尚配飾的可購(gòu)買Pins聯(lián)系在一起。各大品牌開始明白,視覺搜索是它們未來的重要組成部分。

當(dāng)然,問題在于品牌的營(yíng)銷預(yù)算有限。Pinterest并不是唯一一家希望通過視覺人工智能銷售產(chǎn)品的公司。

五、

去年11月,Pinterest推出了其最新版的“Lens:Lens Your Look”,幫助用戶找到新方法來搭配他們已經(jīng)擁有的衣服。在你的衣櫥里拍一些東西,比如一雙厚實(shí)的黑色高跟鞋,然后用文字搜索來尋找可能搭配的衣服(比如“黑色連衣裙”)。“Lens”會(huì)給你提供一個(gè)穿著黑色連衣裙和高跟鞋的人的形象——甚至可能和你自己的品牌和風(fēng)格完全相同。

當(dāng)用戶點(diǎn)擊特定的圖片時(shí),Pinterest會(huì)了解到哪些搜索結(jié)果基本上是正確的,或者是最正確的,而且可以在下次對(duì)它們進(jìn)行優(yōu)先排序。這是該公司對(duì)視覺搜索的完美提煉:挖掘其龐大的數(shù)據(jù)庫(kù),挖掘用戶的品味,擁抱不完美。

但這并不意味著用戶的注意力就會(huì)一直存在。Sharp是第一個(gè)承認(rèn)視覺搜索的確切工具甚至還沒有發(fā)明的人:我們真的會(huì)用我們的手機(jī)攝像頭來進(jìn)行點(diǎn)搜索,還是需要一些AR頭戴設(shè)備來實(shí)現(xiàn)這個(gè)概念呢?“我們還處于早期階段,”Sharp說,“就像90年代中期的文本搜索領(lǐng)域一樣。這是一項(xiàng)技術(shù),很有趣,但沒有人真正深入了解產(chǎn)品是什么,以及它將解決什么問題。”

問題是,如果Pinterest能破解這一密碼的話。我們會(huì)不會(huì)“Pin它”,而不是“谷歌它”?這一前景聽起來令人畏懼,尤其是在Pinterest與世界上一些最有價(jià)值、最強(qiáng)大的公司競(jìng)爭(zhēng)的情況下。

Sharp走到白板前,畫了一個(gè)四象限的坐標(biāo)軸。在X軸上,他寫道“分享和搜索”。在Y軸上,他寫著“文字和視覺”。

文本分享?這個(gè)象限屬于Facebook和Twitter。視覺分享?Facebook、Instagram和Snapchat。搜索文本?這就是谷歌和必應(yīng)。而是通過視覺來尋找?。他在這個(gè)象限里寫了一家公司。“Pinterest。”畫一個(gè)坐標(biāo)軸,將你的公司單獨(dú)放在一個(gè)象限里是一個(gè)典型的創(chuàng)始人舉動(dòng)。但Sharp在一件事上的觀點(diǎn)是正確的:視覺搜索是一種罕見的未被殖民的空間。

“這是這里最值錢的四分之一,”他說。“這是Pinterest的前提。”

原文鏈接:https://www.fastcodesign.com/90152812/pinterest-sees-the-future

編譯組出品。編輯:郝鵬程

編者按:隨著圖像識(shí)別技術(shù)的不斷發(fā)展,視覺搜索也愈加被人所重視,它會(huì)造就下一個(gè)谷歌嗎?近日,F(xiàn)astCodesign發(fā)布了一篇文章,介紹了該領(lǐng)域Pinterest近年來的發(fā)展?fàn)顩r及其背后的潛力與野心。作者為MARK WILSON,文章由36氪編譯。

  一、

這一切都從16個(gè)月前一個(gè)牛油果開始的。

在Pinterest位于舊金山的總部,一個(gè)特殊的牛油果被放置在會(huì)議室的桌子上。Pinterest的創(chuàng)意總監(jiān)AlbertPereta被六名同事簇?fù)碇?,走近水果,小心翼翼地用手機(jī)瞄準(zhǔn)拍攝。他正在測(cè)試該公司的最新發(fā)明,這是一項(xiàng)名為“Lens”的功能。如果測(cè)試正確,它不僅能識(shí)別出這種水果,還能搜索過去7年里上傳至該服務(wù)的數(shù)十億張照片,以尋找類似的圖片。

Pereta拍下照片后,應(yīng)用花了一會(huì)兒時(shí)間與云同步,然后把結(jié)果反饋出來。Pereta的手機(jī)屏幕上充滿了看似無窮無盡的、從各個(gè)角度拍攝的牛油果。

“很多人都很驚嘆,說‘這東西真好!’”Pereta說道。Pinterest已經(jīng)能夠通過視覺線索識(shí)別出了一個(gè)物體,這是一個(gè)非常困難的工程問題。但Pereta并不滿意:“當(dāng)我看著這個(gè)結(jié)果的時(shí)候,我在想,‘誰在乎呢?’”

視覺搜索技術(shù)的效果非常好,但其結(jié)果毫無意義。沒有人會(huì)拍下牛油果的照片,希望能得到一幅幾乎完全相同的牛油果照片,更不用說無窮無盡的照片了。“我們開始問,‘如果你給一個(gè)牛油果拍照,你想要什么?’”Pereta回憶道。有人說他想要一份食譜。“所以你甚至不會(huì)看到牛油果,你會(huì)看到一些粘乎乎的牛油果醬,”Pereta說?;蛘逷interest可以提供關(guān)于如何種植牛油果的信息,或者你可以用牛油果做些什么。“那太不可思議了,”Pereta回憶說。

如今,牛油果的故事已經(jīng)成為了一個(gè)寓言,安放在Pinterest總部的膠合板墻內(nèi)。這提醒人們,個(gè)性化比完美更有價(jià)值。隨著該公司在去年2月推出Lens Beta版測(cè)試工具,深入到新興的視覺搜索領(lǐng)域時(shí),這一點(diǎn)尤為明顯——這個(gè)版本并沒有調(diào)用成千上萬的牛油果圖片。結(jié)合Pereta的見解,這款應(yīng)用能夠提供與它們相關(guān)的想法,比如,制作牛油果醬。這是一個(gè)早期的視角,即Pinterest在非?,F(xiàn)實(shí)的情況下,如何將希望寄托在視覺人工智能上,從而徹底改變?nèi)藗冑?gòu)物和飲食方式的一切行為。

二、

在過去的二十年里,我們通過在搜索欄中輸入信息來尋找網(wǎng)絡(luò)上的東西。由于機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,計(jì)算機(jī)視覺即將讓我們通過拍照來進(jìn)行搜索。谷歌、Facebook、微軟和亞馬遜都在向這項(xiàng)技術(shù)投入大量資源。這也就不足為奇了:谷歌將在2017年通過傳統(tǒng)文本搜索廣告獲得約286億美元的收入。使用Alexa、Siri和GoogleAssistant等服務(wù)的語音搜索功能,現(xiàn)在才剛剛實(shí)現(xiàn)。視覺搜索呢?這可能是一件具有里程碑意義的事情,因?yàn)樵S多技術(shù)專家都設(shè)想未來的智能手機(jī)不會(huì)出現(xiàn)在我們的口袋里,而是在我們的眼睛里。

Pinterest首席執(zhí)行官BenSilbermann表示:“我真的認(rèn)為,攝像頭將成為下一個(gè)鍵盤。它將成為你用來查詢周圍世界、發(fā)現(xiàn)身邊事物、或想象某個(gè)東西可能適合你生活的一個(gè)基本工具。

在這個(gè)競(jìng)爭(zhēng)激烈的領(lǐng)域,Pinterest看起來并不算什么。但其在那堆牛油果下隱藏了很多東西。當(dāng)各種黨派之爭(zhēng)的內(nèi)容占據(jù)了許多應(yīng)用和網(wǎng)站的時(shí)候,Pinterest的2億月活躍用戶就會(huì)轉(zhuǎn)向該服務(wù),從而尋求一種更美好的生活,比如更舒適的客廳、冒險(xiǎn)的旅行,或者健康的零食。根據(jù)尼爾森的一項(xiàng)研究,他們不是在尋找美食照片,也不一些能夠發(fā)到Instagram上的照片,而是他們可以真正烹飪的日常食物:98%的Pinterest用戶表示他們會(huì)嘗試在該服務(wù)中發(fā)現(xiàn)的新東西。廣告商們也開始接受這個(gè)網(wǎng)站。從2015年到2017年,Pinterest的年?duì)I收預(yù)計(jì)將增長(zhǎng)5倍,達(dá)到5億美元,而其在全球范圍內(nèi)的用戶增長(zhǎng)將達(dá)到40%。(Pinterest拒絕就營(yíng)收增長(zhǎng)和預(yù)測(cè)發(fā)表評(píng)論。)

  Ben Silbermann。

Pinterest的受歡迎程度在于,它能夠?yàn)槊恳晃挥脩魟?chuàng)建一個(gè)獨(dú)特的“品味圖譜”,從而推斷出其可能感興趣的其他東西。現(xiàn)在,Pinterest正致力于將計(jì)算機(jī)視覺技術(shù)融入到對(duì)用戶偏好的深入理解中。“所有的東西都在不斷涌現(xiàn),這是Pinterest在為你的實(shí)際生活尋找創(chuàng)意時(shí)的有用之處,”Silbermann說。“如果人們真的用Pinterest來決定他們?cè)诩依镒龅乃惺虑?,比如他們?zhǔn)備烹飪的食物,或者是他們的下一個(gè)假期等等,那就會(huì)有巨大的價(jià)值。”這意味著Pinterest不僅需要像谷歌一樣掌握你正在尋找的東西,還必須預(yù)測(cè)你永遠(yuǎn)不知道的,但你想要的東西。如果這家公司取得成功,它可以利用我們的相機(jī)開啟一個(gè)無窮無盡的個(gè)人發(fā)現(xiàn)世界。Pinterest聯(lián)合創(chuàng)始人EvanSharp表示:“視覺搜索能產(chǎn)生的持久影響不會(huì)是什么特定的產(chǎn)品或功能,而是它讓人們能夠做的事情:將人們看到的任何東西,變成可以用來在互聯(lián)網(wǎng)上發(fā)現(xiàn)更多東西的東西。”

三、

我站在舊金山SOMA社區(qū)的一間花園公寓里拿出了Pinterest應(yīng)用。即便是在地下室的照明設(shè)備中,鏡頭也能很好地工作,將我拍攝的物體與其突出的特征匹配起來。鏡頭不僅能看到一把椅子,還能看到是一把俱樂部的椅子。不僅僅是一個(gè)枕頭,還是一個(gè)kilim枕頭。不僅僅是“藝術(shù)”品,還是一幅Rothko的畫作。通過這個(gè)過程,我實(shí)際上學(xué)到了許多東西。許多識(shí)別結(jié)果伴隨著的都有可操作的鏈接,我可以用它來標(biāo)記、甚至購(gòu)買。

后來,我嘗試通過GoogleLens拍攝類似的照片,這是Pinterest的一個(gè)競(jìng)爭(zhēng)對(duì)手,在今年早些時(shí)候在Pixel手機(jī)上推出了測(cè)試版。谷歌的版本不知道它看到了一把椅子,甚至是家具,并向我道歉。它甚至誤把枕頭當(dāng)作被子。它唯一能與之匹配的是Rothko的作品,不過值得注意的是,人們普遍認(rèn)為,識(shí)別2D藝術(shù)品是視覺搜索工具最簡(jiǎn)單的挑戰(zhàn)之一。

GoogleLens不是很好。至少現(xiàn)在還沒有很好。但你可以看到,視覺AI是如何與公司的更大的業(yè)務(wù)需求以及其他科技巨頭相結(jié)合的。谷歌的業(yè)務(wù)是建立索引,因此該公司希望幫助用戶直觀地識(shí)別周圍的世界,這是有道理的。Facebook有自己的社交圖譜,專注于將用戶與朋友聯(lián)系起來,以及利用人工智能識(shí)別人臉的既得利益。亞馬遜擁有電子商務(wù)。對(duì)它來說,視覺搜索可以成為數(shù)字世界和現(xiàn)實(shí)世界之間的橋梁——例如,你拍攝一雙鞋,在亞馬遜上尋找類似的,也許是更便宜的。每家公司可能會(huì)以不同的方式對(duì)待視覺人工智能,但其含義是一樣的:在這個(gè)新興領(lǐng)域,即使現(xiàn)在還不能清楚地表達(dá)出它的價(jià)值,也會(huì)有一些資金在涌入這個(gè)新興領(lǐng)域。Forrester的搜索分析師CollinColburn說:“想想看,你有可能會(huì)拍一張照片,去尋找你甚至無法描述的東西。這是非常強(qiáng)大的東西。這可能是最不成熟的搜索,但它可能最有潛力。”

谷歌有數(shù)百名員工獨(dú)立從事視覺人工智能的開發(fā)工作。Facebook擁有2萬名員工和300名人工智能研究人員,此外它還在社交網(wǎng)絡(luò)上進(jìn)行120萬個(gè)視覺人工智能實(shí)驗(yàn)。亞馬遜擁有超過50萬名員工,其中有5000名員工在Alexa上工作——它的新EchoShow不僅有麥克風(fēng),還配備了與Alexa互動(dòng)的攝像頭——可以讓亞馬遜看到你的整個(gè)房間。Pinterest?該公司只有12名員工致力于視覺搜索。

但Pinterest比看起來更強(qiáng)大。首先,它擁有大量數(shù)據(jù)來訓(xùn)練視覺人工智能。你擁有的圖像越多,算法就會(huì)越智能,而且它在提供用戶真正想要的推薦時(shí)也會(huì)變得更好。許多研究人員使用的最大公共數(shù)據(jù)集——Image Net,包括1400萬個(gè)日常物品的眾包照片網(wǎng)站。Pinterest擁有數(shù)十億張照片——由熱心的Pinner從博客上瀏覽上傳,或者是由公司自己發(fā)布——大部分都有完美的舞臺(tái)和燈光效果,因?yàn)樗鼈兪枪俜降漠a(chǎn)品攝影。電腦能更容易地看到完美的圖像。同樣重要的是:這些照片已經(jīng)被Pinterest的忠實(shí)用戶親手標(biāo)記并貼上標(biāo)簽。

卡內(nèi)基梅隆大學(xué)機(jī)器學(xué)習(xí)主管ManuelaVeloso表示:“數(shù)據(jù)集越大,你感到驚訝的可能性就不會(huì)越大。Pinterest的數(shù)十億數(shù)據(jù)的有趣之處在于,它們將會(huì)覆蓋各種極端案例。”

此外,Pinterest的設(shè)計(jì)也會(huì)在用戶搜索時(shí)提供一些模糊的結(jié)果。這是Pinterest從牛油果學(xué)到的經(jīng)驗(yàn)。精確匹配是谷歌搜索的特色,它已經(jīng)針對(duì)特定問題進(jìn)行了優(yōu)化,比如“你如何烤魚?”后面將會(huì)有一個(gè)完美的鏈接。Pinterest的用戶往往會(huì)提出更含糊的問題:他們每周可能會(huì)搜索幾次“海鮮晚餐創(chuàng)意”。對(duì)他們來說,不精確的答案并不是錯(cuò)誤。而是靈感。

換句話說,Pinterest的人工智能在視覺搜索方面可能會(huì)失敗,但幸運(yùn)的是能找到正確答案。想象一下,Siri會(huì)做同樣的事情。“在其他一些公司,我們談到了精確的召回。但說到底,用戶對(duì)功能的感覺是非常有用的,”Pinterest的工程主管LiFan表示。他們可能不需要100%的精確度。沒關(guān)系。只要我們實(shí)現(xiàn)了預(yù)期,他們就會(huì)覺得這是一種持續(xù)的體驗(yàn),他們覺得這很有用。

  LiFan。

在競(jìng)爭(zhēng)平臺(tái)因侵犯隱私而受到攻擊的時(shí)候,Pinterest也已經(jīng)贏得了用戶的信任。人們把Pinterest看作是搜索引擎或社交網(wǎng)絡(luò)之外的東西。Silbermann說:“我們?cè)噲D與用戶建立的關(guān)系是,當(dāng)你分享自己的事情時(shí),是基于你想要更好的推薦,我們會(huì)為你提供你想要的內(nèi)容。”這一預(yù)期相當(dāng)明確。你用Pinterest來尋找一個(gè)時(shí)尚風(fēng)格,所以如果我們問你:“你最喜歡的顏色是什么?”這一點(diǎn)沒有任何侵犯性。”這樣的互動(dòng)讓Pinterest能夠提供既出人意料又準(zhǔn)確的結(jié)果。它的設(shè)計(jì)語言更像是精心挑選的而不是經(jīng)過精心策劃的,而且也比機(jī)器人更人性化。

四、

Pinterest成立于2010年,主要是在設(shè)計(jì)上花費(fèi)了巨大投資:它可以讓用戶收集和整理感興趣的主題,而不是難看的藍(lán)色文字鏈接,而是虛擬索引卡上的華麗照片。聯(lián)合創(chuàng)始人Sharp是一位具有創(chuàng)造性而且有遠(yuǎn)見的人,他曾在哥倫比亞大學(xué)的研究生建筑學(xué)院接受過培訓(xùn),是首席執(zhí)行官Silbermann的完美補(bǔ)充——他是一名管理顧問,后來成為了企業(yè)家。該平臺(tái)非常受歡迎:2012年,comScore分析公司宣布它是歷史上增長(zhǎng)最快的Web服務(wù)。

Pinterest的照片卡采用了一種新穎的設(shè)計(jì)方式,比如谷歌等巨頭,從搜索結(jié)果到Android操作系統(tǒng),都在使用它們。不過,自那以后,它的飛速增長(zhǎng)已經(jīng)放緩。如今,光芒已經(jīng)被Instagram的8億月活躍用戶和使用激進(jìn)AR技術(shù)的Snapchat所掩蓋。

不過,Pinterest并未追求激進(jìn)的增長(zhǎng),而是在其核心產(chǎn)品上加倍投資:預(yù)測(cè)用戶想看什么。“我們最終在機(jī)器學(xué)習(xí)上投入了大量資金,”Sharp說,他現(xiàn)在是公司的首席產(chǎn)品官。“大部分用戶看到的內(nèi)容都是通過算法來決定的,”他說。“這是一個(gè)推薦,一個(gè)搜索結(jié)果,或者一個(gè)RelatedPin。”

  EvanSharp。

后一項(xiàng)功能是在2013年發(fā)布的,它能根據(jù)你看過的內(nèi)容生成一個(gè)相對(duì)簡(jiǎn)單的推薦Pin列表。到2014年,公司才委派了一些人工智能工程師,讓它變得更好。他們通過訓(xùn)練算法來推薦相關(guān)的話題,并根據(jù)視覺線索推薦類似的項(xiàng)目,優(yōu)先選擇能獲得最多點(diǎn)擊量的Pin。如果你點(diǎn)擊一個(gè)由倒放的樹枝做成的衣架,RelatedPins中會(huì)包括一份韋恩(Venn)圖,里面包含了一些合理的建議,包括房屋裝飾和木質(zhì)裝潢,包括樹干上的衣架、小房間的分隔物,以及一個(gè)回收的谷倉(cāng)木鑰匙托盤。今天,RelatedPins占據(jù)了Pinterest所有互動(dòng)中的40%。

2016年,該公司在視覺人工智能領(lǐng)域進(jìn)行了早期投資,并在谷歌上招募了計(jì)算機(jī)視覺專家Li Fan。她在谷歌工作了8年,之后在百度工作,領(lǐng)導(dǎo)了1000名工程師。然后她又回到谷歌,選擇了一個(gè)更加專注的角色,擔(dān)任谷歌圖片搜索的負(fù)責(zé)人。最后,Pinterest找上門來。“作為領(lǐng)導(dǎo)者和個(gè)人,LiFan的價(jià)值觀與Pinterest的價(jià)值觀非常契合,”Silbermann說。“有一件事讓我產(chǎn)生了共鳴,那就是她認(rèn)為科技是一種豐富人們生活的方式,而不是單單的技術(shù)。”

在LiFan的領(lǐng)導(dǎo)下,Pinterest在Lens、Pins和公司的瀏覽器擴(kuò)展工具上進(jìn)行的視覺搜索同比增長(zhǎng)了近70%,每月的搜索量超過3億次。與此同時(shí),Pinterest的商業(yè)合作伙伴已經(jīng)看到了他們的 “ShoptheLook”Pins點(diǎn)擊量背后巨大的潛力——這一功能可以讓用戶點(diǎn)擊,然后購(gòu)買圖片中的商品。

所有這些都匯聚成一個(gè)豐富的商業(yè)機(jī)會(huì)。FirstMarkCapital的風(fēng)險(xiǎn)投資人RickHeitzmann表示:“最初,Pinterest是由用戶類別進(jìn)行管理的。”他曾在2009年對(duì)Pinterest的聯(lián)合創(chuàng)始人進(jìn)行了第一次調(diào)查,并參與了此后的每一輪投資。“但隨著科技的發(fā)展,它是由人工智能、圖像識(shí)別,以及找到你喜愛和關(guān)心的東西所驅(qū)動(dòng)的。”Pinterest的使命是將視覺搜索變成一項(xiàng)內(nèi)容,而Heitzmann對(duì)這些機(jī)會(huì)感到非常興奮。“你可以看到潛在的市場(chǎng)規(guī)模很大。”

Pinterest已經(jīng)向廣告商提供了一個(gè)吸引注意力的平臺(tái)。根據(jù)一項(xiàng)調(diào)查顯示,93%的用戶使用Pinterest來制定購(gòu)物計(jì)劃,87%的人通過Pinterest購(gòu)買了一些東西。但至關(guān)重要的是,Pinner還沒有確定他們想要的確切產(chǎn)品。根據(jù)Pinterest的數(shù)據(jù),97%的搜索請(qǐng)求沒有一個(gè)特定的品牌。與此同時(shí),視覺搜索工具讓這個(gè)品牌發(fā)現(xiàn)過程更加誘人,尤其是當(dāng)搜索結(jié)果與用戶的個(gè)人“口味圖譜”相關(guān)聯(lián)的時(shí)候。

Target最近成為了Pinterest的Lens技術(shù)的獨(dú)家美國(guó)零售合作伙伴。很快,在該零售商的主應(yīng)用內(nèi),你將可以使用集成版的Lens,比如說,拍攝一盞臺(tái)燈,并看到由Target銷售的視覺效果相似的產(chǎn)品。“我們的客人在每一種購(gòu)物體驗(yàn)中都渴望舒適和方便。”視覺搜索是一個(gè)巨大的解鎖工具,因?yàn)樗水a(chǎn)品搜索中的很多障礙,”Target的CMORickGomez說。“通過簡(jiǎn)單地拍下一件感興趣的商品,Pinterest的鏡頭將會(huì)返回那些專門針對(duì)我們的客戶所尋找的產(chǎn)品。”(Walmart、AmericanEagle和TommyHilfiger在他們的應(yīng)用上也有視覺搜索功能,這是由初創(chuàng)公司Slyce創(chuàng)建的。)Pinterest還與三星合作,為Galaxy智能手機(jī)提供視覺搜索功能,并與Shopstyle合作,將Lens的結(jié)果與500萬多種時(shí)尚配飾的可購(gòu)買Pins聯(lián)系在一起。各大品牌開始明白,視覺搜索是它們未來的重要組成部分。

當(dāng)然,問題在于品牌的營(yíng)銷預(yù)算有限。Pinterest并不是唯一一家希望通過視覺人工智能銷售產(chǎn)品的公司。

五、

去年11月,Pinterest推出了其最新版的“Lens:LensYourLook”,幫助用戶找到新方法來搭配他們已經(jīng)擁有的衣服。在你的衣櫥里拍一些東西,比如一雙厚實(shí)的黑色高跟鞋,然后用文字搜索來尋找可能搭配的衣服(比如“黑色連衣裙”)。“Lens”會(huì)給你提供一個(gè)穿著黑色連衣裙和高跟鞋的人的形象——甚至可能和你自己的品牌和風(fēng)格完全相同。

當(dāng)用戶點(diǎn)擊特定的圖片時(shí),Pinterest會(huì)了解到哪些搜索結(jié)果基本上是正確的,或者是最正確的,而且可以在下次對(duì)它們進(jìn)行優(yōu)先排序。這是該公司對(duì)視覺搜索的完美提煉:挖掘其龐大的數(shù)據(jù)庫(kù),挖掘用戶的品味,擁抱不完美。

但這并不意味著用戶的注意力就會(huì)一直存在。Sharp是第一個(gè)承認(rèn)視覺搜索的確切工具甚至還沒有發(fā)明的人:我們真的會(huì)用我們的手機(jī)攝像頭來進(jìn)行點(diǎn)搜索,還是需要一些AR頭戴設(shè)備來實(shí)現(xiàn)這個(gè)概念呢?“我們還處于早期階段,”Sharp說,“就像90年代中期的文本搜索領(lǐng)域一樣。這是一項(xiàng)技術(shù),很有趣,但沒有人真正深入了解產(chǎn)品是什么,以及它將解決什么問題。”

問題是,如果Pinterest能破解這一密碼的話。我們會(huì)不會(huì)“Pin它”,而不是“谷歌它”?這一前景聽起來令人畏懼,尤其是在Pinterest與世界上一些最有價(jià)值、最強(qiáng)大的公司競(jìng)爭(zhēng)的情況下。

Sharp走到白板前,畫了一個(gè)四象限的坐標(biāo)軸。在X軸上,他寫道“分享和搜索”。在Y軸上,他寫著“文字和視覺”。

文本分享?這個(gè)象限屬于Facebook和Twitter。視覺分享?Facebook、Instagram和Snapchat。搜索文本?這就是谷歌和必應(yīng)。而是通過視覺來尋找?。他在這個(gè)象限里寫了一家公司。“Pinterest。”畫一個(gè)坐標(biāo)軸,將你的公司單獨(dú)放在一個(gè)象限里是一個(gè)典型的創(chuàng)始人舉動(dòng)。但Sharp在一件事上的觀點(diǎn)是正確的:視覺搜索是一種罕見的未被殖民的空間。

“這是這里最值錢的四分之一,”他說。“這是Pinterest的前提。”

原文鏈接:https://www.fastcodesign.com/90152812/pinterest-sees-the-future

編譯組出品。編輯:郝鵬程

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)