游戲行業(yè), 我們能做哪些大數(shù)據(jù)分析應(yīng)用呢?問題留給大家思考, 先看看下面這些內(nèi)容是否能給我們帶來一些啟發(fā)呢?
筆者是在一個MMO項目做過兩年數(shù)據(jù)分析,在一家中型公司負責(zé)過從頭建設(shè)數(shù)據(jù)分析中心,面試聊過不少人,也對大數(shù)據(jù)有興趣有過一些了解,思考過這個問題。
1.游戲的數(shù)據(jù)分析,其總的思路其實是很像大數(shù)據(jù)的思路。
《羅輯思維》有一期講,大數(shù)據(jù)其實核心不是大,而是全數(shù)據(jù),是將你各種行為的數(shù)據(jù)匯總在一起,從而能通過數(shù)據(jù)看到你完整行為軌跡,進行分析。在日常生活中,比如買衣服,你看了什么衣服,試穿了什么衣服,你重復(fù)去買衣服,這些信息商家都是不知道的,而商家的建設(shè)就是要全,比如優(yōu)衣庫做的你去試衣服的時候會進行記錄,比如很多商家做會員卡,也能起到收集這個信息的目的。
而一個日志建設(shè)比較完善的游戲,是可以看到幾乎全部有價值的行為的,你做的每一件事都可以拿來分析,而大數(shù)據(jù),正是靠這種數(shù)據(jù)的全,來達成有價值的分析。
2.但是,游戲行業(yè)目前能做的絕大多數(shù)據(jù)分析,其實跟大數(shù)據(jù)沒有任何關(guān)系。
我做數(shù)據(jù)分析,和教數(shù)據(jù)分析的方法,是像游戲策劃一樣理解游戲,然后用excel分析。只要懂加減乘除,集合這些概念,最多用一點線性相關(guān),和聚類分析。但是核心是懂游戲。
以前我自己用這套方法的時候還不確定是不是因為我太菜了所以只能用這套方法,后來自己招人建設(shè)數(shù)據(jù)分析中心的時候,面試了很多人,年薪30W在top端游公司的,年薪25W在著名手游公司的,年薪25W帶一個3-5人團隊的。他們都是用數(shù)據(jù)挖掘之類的方法做,但是談到具體做過什么幫助游戲改進的案例,都講不出什么。其中有一個我以前認識,多聊了兩句,他也覺得自己用建模,挖掘這樣的辦法,適合在有大量游戲的公司,對所有游戲做一些通用的東西,起到一些幫助(這件事的關(guān)鍵是游戲項目組要有足夠的數(shù)據(jù)意識,否則沒法配合),而在單個游戲的改進上,確實起不到多大作用。
數(shù)據(jù)挖掘之類的方法在游戲項目中少有有效應(yīng)用,核心原因還是單個游戲都太小,用不起很專業(yè)的。用數(shù)據(jù)挖掘最好的應(yīng)該是電商這種行業(yè),比如亞馬遜,因為他們的分析是針對整個公司的,整個公司的銷售額都會受到數(shù)據(jù)的影響,比如亞馬遜。而游戲方面,單個游戲年收入5億以上的才有幾個?這些做到高收入的游戲,他們會覺得我不是靠數(shù)據(jù)做到今天的,我也沒必要去投入做數(shù)據(jù)挖掘(畢竟這種游戲有那么多事情需要投入,動不動就百人團隊)。所以針對單個游戲有效的大數(shù)據(jù)研究方法,目前還幾乎沒有。
3.數(shù)據(jù)挖掘目前在游戲行業(yè)能做什么?——流失預(yù)測
這是我看過唯一一個案例,是數(shù)據(jù)挖掘在游戲行業(yè)很好的應(yīng)用,但潛力還沒有被充分挖掘出來。我見過大公司做的最好的,能達到80%準確率:80%的流失用戶被預(yù)測到了,80%被預(yù)測到的用戶真的流失了。也見過能做到60-70%的。這種分析真的是大數(shù)據(jù)的思路,他不需要理解游戲,只要把足夠多的數(shù)據(jù)放進去,就能預(yù)測流失。反倒是從策劃角度經(jīng)過規(guī)劃的數(shù)據(jù),基本是不可能準確預(yù)測流失的(面試到講這條路的,就直接pass了。做過流失預(yù)測自己根本不知道準確率多少的也直接pass了)。
說潛力沒有挖掘出來,因為這個分析的目的和傳統(tǒng)游戲數(shù)據(jù)分析不同,不是改進游戲,而是運營干涉。發(fā)現(xiàn)這些用戶快要流失,就想辦法給他們好處,留住他們。但是大部分游戲的框架并不允許做這件事,而沒有足夠數(shù)據(jù)訓(xùn)練的游戲項目組,也很難配合起來。
所以這種方式的應(yīng)用,需要足夠大的公司(有錢投入數(shù)據(jù)挖掘團隊),足夠多的項目(為一個項目性價比差),有足夠數(shù)據(jù)訓(xùn)練的游戲項目組(數(shù)據(jù)挖掘如果是單獨團隊,和項目組的配合就是最大的問題)。
插一段:
這種流失預(yù)測的挖掘,本身也是最符合大數(shù)據(jù)的思路,不要因果性,只要相關(guān)性。你不需要知道玩家為什么流失,沒有一個游戲是能完全不流失的。但是你知道有些人要流失了,給他們一些好處,有可能他們就會留下來。只要知道相關(guān)性,針對性的采取措施就好了。
沃爾瑪?shù)钠【颇虿及咐?,害了太多人。這個案例讓人覺得,這種相關(guān)背后是有一個我能推導(dǎo)出來的邏輯因果的。其實沃爾瑪還有很多很多完全看不出邏輯的案例,什么晴天蛋糕賣得好,雨天面包賣得好之類的,羅輯思維那期里有講。沃爾瑪不需要知道原因,只要晴天把能蛋糕多準備一點,多擺出來,就好了。
在看得見的未來,數(shù)據(jù)還不能,也不應(yīng)該在游戲業(yè)被很深的應(yīng)用。想想zynga。
有一位從zynga離職的人說過:那些說A/B測試成本高的公司,都是配套機制建設(shè)的不好,在zynga,一次A/B測試可能半天就能做好。但是A/B測試真正的成本,不是執(zhí)行的成本,而是把設(shè)計者的思路限制在數(shù)據(jù)上,限制在能用A/B測試看出區(qū)別的微小改進上。
拓展思路:
從另一個層面,我們聯(lián)系到實際出發(fā)來看看, 目前數(shù)據(jù)源比較成熟的,主要包括社交數(shù)據(jù)(包括社交網(wǎng)站、論壇等來源)、搜索數(shù)據(jù)和位置數(shù)據(jù)。
社交數(shù)據(jù):關(guān)注分析。分析用戶在發(fā)布會展相關(guān)的內(nèi)容的時候,其他關(guān)聯(lián)詞匯的熱度。例如伴隨“水果+會展”出現(xiàn)頻率最高的是“農(nóng)藥”、“安全”一類的詞匯,那可能會幫助水果展銷會的站臺和服務(wù)設(shè)置,例如增加綠色水果展位,或者采摘服務(wù)展位。
社交數(shù)據(jù):用戶態(tài)度分析。社交網(wǎng)站如果能開放用戶的詳細信息的話,你也可以分析哪些人對哪類會展持正面態(tài)度,哪些人持負面態(tài)度。
搜索數(shù)據(jù):跟社交數(shù)據(jù)類似,分析關(guān)聯(lián)搜索熱詞,判斷用戶關(guān)注什么和態(tài)度。
位置數(shù)據(jù):分析參加展會(非受邀的)的人來自何處、去向哪里,以便下一次展會重點在哪里投放廣告和推廣。