洞察消費者全部的行為,是商業(yè)社會一直以來的夢想。今天,這個夢想似乎不再遙不可及,因為我們手中已握有最重要的拼圖,它就是數(shù)據(jù)。從電子商務(wù)誕生之日起,數(shù)據(jù)就是區(qū)別于傳統(tǒng)商業(yè)的利器,因而不夸張地說,數(shù)據(jù)的挖掘和應(yīng)用是電商的競爭力,更是使命。
本系列文章旨在從理論到實操,厘清數(shù)據(jù)與商業(yè)的關(guān)系,從營銷到轉(zhuǎn)化,探討電商數(shù)據(jù)化運營的道與術(shù)。本文作為本系列的第一篇之理論篇,從大數(shù)據(jù)的定義講起,啟示我們?nèi)绾芜\用大數(shù)據(jù)的思維,按圖索驥拼出一張商業(yè)地圖。作者車品覺現(xiàn)任阿里巴巴副總裁,商業(yè)智能部負責人,是電商大數(shù)據(jù)挖掘和應(yīng)用的專家。
何謂大數(shù)據(jù)
什么是大數(shù)據(jù)?在大多數(shù)人理解中,是企業(yè)用數(shù)據(jù)來優(yōu)化自己的流程、產(chǎn)品以及決策,讓運營變得更有效。但我認為,這還不能涵蓋大數(shù)據(jù)范疇。
事實上,大數(shù)據(jù)是一個包含了技術(shù)和商業(yè)兩個層面的綜合性的概念。
一方面是技術(shù)層面的。在技術(shù)層面,數(shù)據(jù)并不是一個新鮮的概念,從計算機誕生的那一刻起就伴隨著數(shù)據(jù)的產(chǎn)生,但是在那個時候并沒有大數(shù)據(jù)的概念。一直以來,要進行海量的數(shù)據(jù)存儲、高效的數(shù)據(jù)計算,都需要有非常強大的計算機來支撐,而動輒百萬美元計價的大型機的硬件成本和每月數(shù)萬美元的維護成本并不是每一個企業(yè)都能夠承擔的。在高昂的成本面前,數(shù)據(jù)的使用成為了企業(yè)的一種“奢侈品”,并沒有得到很大的普及。最近幾年來,技術(shù)在不斷地進步和發(fā)展,類似于Hadoop這樣的分布式存儲和計算系統(tǒng)的出現(xiàn),大大提高了數(shù)據(jù)存儲和計算的效率,使海量數(shù)據(jù)應(yīng)用于商業(yè)變成了可能。大數(shù)據(jù)的概念也開始被越來越多的人關(guān)注。
另一方面是商業(yè)層面的。對于商業(yè)而言,最重要的是能夠讓企業(yè)通過數(shù)據(jù)獲得更多的收益。傳統(tǒng)意義上的數(shù)據(jù)是面向業(yè)務(wù)的,對于每一條業(yè)務(wù)線來說都會有數(shù)據(jù)的積累,相信很多企業(yè)已經(jīng)在這方面做得很好了,可以說“量”已經(jīng)足夠了。如果連“量”這方面都沒有做好,那我覺得有必要先去修煉一下內(nèi)功,畢竟數(shù)據(jù)不是一天就能建成的。而能夠讓商業(yè)產(chǎn)生更大價值甚至顛覆性創(chuàng)新的則是多樣性的數(shù)據(jù)。這個多樣性是指能夠?qū)⒍喾N數(shù)據(jù)連接在一起看,通過彼此之間的關(guān)聯(lián)和互動讓數(shù)據(jù)產(chǎn)生商業(yè)的價值。比如谷歌公司的“流感趨勢”預(yù)測模型就受到了很多人的關(guān)注。作為一家互聯(lián)網(wǎng)公司,谷歌是如何知道流感趨勢的呢?它的核心價值就在于大數(shù)據(jù)的應(yīng)用。谷歌通過分析發(fā)現(xiàn),在流感的不同階段,某些與流感有關(guān)的藥品、癥狀的關(guān)鍵詞會表現(xiàn)出不同數(shù)量和特征,谷歌正是通過這種多樣性數(shù)據(jù)的關(guān)聯(lián)來發(fā)現(xiàn)了數(shù)據(jù)價值。
對于企業(yè)來說,良好的指標體系可以增加企業(yè)可預(yù)見的范圍。通常情況下,數(shù)據(jù)可以通過是否正向作用、是否可預(yù)見兩個維度歸納成四個類別(見圖1)。對于企業(yè)而言,那些具有正向作用且可預(yù)見的數(shù)據(jù)通常作為運營指標進行關(guān)注,而那些具有反向作用且可預(yù)見的數(shù)據(jù)通常作為風險來規(guī)避,這都是需要先修煉好的內(nèi)功。但是除了圖右邊可預(yù)見的數(shù)據(jù)之外,還有大量的不可預(yù)見的數(shù)據(jù)。例如雙十一,淘寶的目標是單天銷售100億,結(jié)果卻實現(xiàn)了191億,那么91億便是不可預(yù)見的驚喜。對于我們來說,我們需要把不可預(yù)見的變成可預(yù)見的,也就是把驚喜變成可預(yù)見的,讓它發(fā)揮更大的價值,把悲劇變成可預(yù)見的,最大可能地減少它。
縮小未知世界
如果說上述都是對大數(shù)據(jù)定義的解釋,那么下面用一張圖更清楚地展現(xiàn)企業(yè)與數(shù)據(jù)的關(guān)系。如圖2所示,橫坐標上方的是企業(yè)內(nèi)部數(shù)據(jù),包括財務(wù)數(shù)據(jù)、運營數(shù)據(jù)、市場數(shù)據(jù)這類公司的結(jié)構(gòu)型數(shù)據(jù),以及WA和MA,即網(wǎng)站的分析數(shù)據(jù)和移動應(yīng)用數(shù)據(jù);下方是企業(yè)外部數(shù)據(jù),包括百度、SNS的社會數(shù)據(jù),和comScore、Hitwise、艾瑞這類的第三方數(shù)據(jù),這些往往是競爭對手的數(shù)據(jù)。
事實上,這四類數(shù)據(jù)都沒有得到電商企業(yè)足夠的重視。大多數(shù)有傳統(tǒng)商業(yè)背景的電商企業(yè),對網(wǎng)站分析數(shù)據(jù)都不太專注。但往往它們一旦能用上網(wǎng)站分析數(shù)據(jù),會大大改變自己內(nèi)部的數(shù)據(jù)。
例如,一個消費者看了但不買,沒有產(chǎn)生消費,所以這組數(shù)據(jù)不可能出現(xiàn)在企業(yè)的經(jīng)營數(shù)據(jù)中,絕對是網(wǎng)站分析數(shù)據(jù)。換而言之,如果要知道企業(yè)未來的機會,起碼可以把那些看了不買的消費者轉(zhuǎn)變成客戶,如果能轉(zhuǎn)化20%,你的市場會增加多少?
在這種情況下,如果你無法解釋市場份額增加的原因,那么這個就屬于“驚喜”;但當你看懂數(shù)據(jù),當“驚喜”變得更加確定并做出相應(yīng)的調(diào)整,不可知的東西慢慢變小,公司也會越來越聰明(Data smart)。
相比較對未知“驚喜”的探索,對未知風險的警惕顯得更為重要。當競爭數(shù)據(jù)化,不再是去看對手做了什么事,而是從那些“微聲音”中感受危機,例如,以前A公司的消費者,有10%是先去B公司看看后再來A公司的,現(xiàn)在這個比例變成了30%,說明B公司的影響力比以前大,一旦B公司策略有變化,對于A公司便是危險。所以,需要用一些非結(jié)構(gòu)化的數(shù)據(jù)不斷補充,這就是大數(shù)據(jù)的范疇。
除此之外,SNS、百度這類的社會數(shù)據(jù)也是很大一塊非結(jié)構(gòu)化的數(shù)據(jù)。這些社會數(shù)據(jù)不單只是用來評價公司口碑的好壞,同樣能幫助公司進行一些決策,只是一直沒有找到這個連接點。
表面上,這套框架已經(jīng)很全面,但是盡管第五個元素沒有加入,可運營的能力還是極低。所謂的第五元素便是人,當不同的用戶群走進去后,整套框架立刻變得千變?nèi)f化。
在蛛絲馬跡中找數(shù)據(jù)
在商業(yè)環(huán)境中的企業(yè),究竟應(yīng)該收集什么數(shù)據(jù),哪些數(shù)據(jù)對企業(yè)重要,這個數(shù)據(jù)究竟是社會數(shù)據(jù)、競爭數(shù)據(jù)、交互數(shù)據(jù)還是經(jīng)營數(shù)據(jù),這些都需要思考。
事實上,不少公司在收集數(shù)據(jù)上存在問題。如果早上8點你在A路上,覺得特別堵,怎么解釋那條路那天特別堵呢?必須收集與A路相鄰相交的各條路的情況,如果這些周邊數(shù)據(jù)不收集,只關(guān)注了一個數(shù)據(jù),是沒法驗證A路堵車原因的。
這就是說,數(shù)據(jù)收集過程是沒有邊界的,不可能因為大數(shù)據(jù)的關(guān)系,什么數(shù)據(jù)都去收集,但一些關(guān)鍵性的核心數(shù)據(jù)以及周邊數(shù)據(jù)必須收集,否則一旦錯過,就沒有機會。
在目前電商中,最欠缺的是內(nèi)部監(jiān)控數(shù)據(jù)。簡單舉例,怎么去評價整個網(wǎng)站、店鋪運營做得好不好,大多數(shù)商家是沒有精準收集的。正是對自身運營含糊,使得突然的業(yè)務(wù)上漲只能歸功于好運,并不清楚為什么會漲。而如果突然變得不好,在找不到原因的情況下,風險控制更是無從談起。
這些現(xiàn)象的原因是大多數(shù)公司的數(shù)據(jù)之間(經(jīng)營數(shù)據(jù)、用戶交互數(shù)據(jù)、競爭數(shù)據(jù)、社會數(shù)據(jù))是不通或者缺乏周邊視野的。其中缺乏數(shù)據(jù)框架是重要原因。
此外,在國內(nèi),運用社會數(shù)據(jù)的例子不是太多,大多數(shù)都是用社會數(shù)據(jù)來分析一個公司的輿情,但會發(fā)現(xiàn)很多公司用完一段時間就銷聲匿跡。其實,社會數(shù)據(jù)同樣可以幫助企業(yè)減少風險,甚至預(yù)知市場。那些對企業(yè)有影響的“微聲音”早就存在了,但企業(yè)可能會忽略了其中的重要線索。
例如,我在一家B2B公司的時候,曾經(jīng)提出一組數(shù)據(jù),如何多角度去確定一個批發(fā)賣家是不是騙子。其中的元素很簡單,用他在網(wǎng)站所注冊的郵件地址去搜索,看與其公布在其他網(wǎng)站的郵箱地址是否相同,如果這個郵箱多次出現(xiàn)則說明這個人比較可信,如果這個郵箱在其他網(wǎng)站都搜索不到,風險便比較大。我們用兩組歷史數(shù)據(jù)去跑,發(fā)現(xiàn)的確是這樣,風險可以減少30%以上。這便是應(yīng)用社會數(shù)據(jù)。
另外一個應(yīng)用社會數(shù)據(jù)的案例,同樣是在B2B平臺。為了推出一些新的類目,我每天逛一些美國網(wǎng)站,從公開的數(shù)據(jù)去研究,到底美國B2C網(wǎng)站買了哪些Google關(guān)鍵詞,看這些關(guān)鍵詞的價格記錄,根據(jù)它們買的關(guān)鍵詞來估計未來的趨勢。當時我認為,美國B2C網(wǎng)站內(nèi)的SEM達人肯定比中國人更懂美國的趨勢。
只要關(guān)注達人在關(guān)注什么關(guān)鍵詞,知道他們的數(shù)據(jù)后,再用其他數(shù)據(jù)來驗證到底會不會是趨勢。簡單來說,也是運用社會數(shù)據(jù)。所以,在運用社會數(shù)據(jù)時,首先要充滿好奇地關(guān)注周邊數(shù)據(jù),好奇心會帶你找到很多有趣的數(shù)據(jù)。
舉個好玩的例子:以前,很多京東的競爭對手都好奇它每天能做多少單,那時候,只要早上在京東下訂單,晚上再在京東下個訂單就能知道。因為最初京東的訂單編號是一個一個加上去的,后來京東自己也發(fā)現(xiàn)了,便改了。
很多時候,看數(shù)據(jù)就要像福爾摩斯一樣,要從蛛絲馬跡中去判斷,數(shù)據(jù)會偷偷地“走”出來,只要你有足夠的心去看待它。
數(shù)據(jù)拼圖爭奪戰(zhàn)
實際上,對于現(xiàn)在的公司來說,需要的是大數(shù)據(jù)的精神,而非大數(shù)據(jù)的架構(gòu),這是兩個不一樣的概念,千萬不要混為一談。
大數(shù)據(jù)架構(gòu)是技術(shù)性的架構(gòu),在中國擁有大數(shù)據(jù)架構(gòu)的企業(yè)屈指可數(shù)。即使阿里巴巴、騰訊有著非常強大的大數(shù)據(jù)技術(shù),但仍然沒有形成真正大數(shù)據(jù)的框架,都還在路上。
其實,對于這些互聯(lián)網(wǎng)大佬而言,大數(shù)據(jù)的真正價值是數(shù)據(jù)拼圖,但大家究竟在拼什么呢?追本溯源,商業(yè)是為了賺錢,實際上,是用消費者的行為在賺錢,但沒有人知道一個消費者行為的全貌。數(shù)據(jù)拼圖就是用已知的東西、用數(shù)據(jù)的方法來找出未知的東西,以期能做出一個決定,拼出一個消費者購物行為的拼圖。
一個新用戶進來,真實價值有多大?他的行為是怎么樣的?他的購買喜好怎么樣?當空間和時間(Marketing的4P)變化的時候,剛才講到的行為相對有什么改變……要知道這些,就需要拼圖。一旦知道這些答案,相信你就沒有對手了。
只可惜現(xiàn)在誰都沒法拼出這張圖。淘寶有大量的購物數(shù)據(jù)(Transactional data),可以從購物數(shù)據(jù)中去找出消費者在購物時的偏好;騰訊有大量的社交類數(shù)據(jù)(Social data),可以從社會數(shù)據(jù)中拼出消費者在SNS上面所表達出來的他們的需要;百度有大量的帶有明確目的的搜索數(shù)據(jù) (Intention data),可以從大量搜索數(shù)據(jù)中去找出消費者的行為需要是什么。
我的前前老板是沃爾瑪?shù)腃OO,不懂數(shù)據(jù),但是告訴我,根據(jù)他在沃爾瑪做了這么多年的經(jīng)驗,總有一天,當一個顧客走進沃爾瑪大門時,就知道他要什么。這個是零售業(yè)的老大相信的,十年內(nèi)這個事情就要發(fā)生,所以沒數(shù)據(jù)會很可憐,這個世界會出現(xiàn)兩種人——數(shù)據(jù)的富人和數(shù)據(jù)的窮人。
現(xiàn)在越來越多的公司在用數(shù)據(jù)挖掘,但其實都沒有真正用好,而真正用到大數(shù)據(jù)的公司更是少之又少。以我的理解,現(xiàn)在能用上大數(shù)據(jù)的公司,一般來說產(chǎn)品經(jīng)理都很會用數(shù)據(jù)。無論是Google還是Facebook,凡是大數(shù)據(jù)很厲害的公司,都有一套很好的大數(shù)據(jù)發(fā)現(xiàn)系統(tǒng)。
在過去的幾年,F(xiàn)acebook不斷地更新發(fā)現(xiàn)系統(tǒng)。兩年前,他們的發(fā)現(xiàn)系統(tǒng)可以通過一個男生輸入的關(guān)鍵詞,推測出他未來離婚的可能性會達到多少。
雖然我在負責BI部門,但我認為,好的發(fā)現(xiàn)系統(tǒng)是不需要BI部門的人跑數(shù)據(jù)的,凡是要用上大量數(shù)據(jù)分析師資源去跑數(shù)據(jù)的公司,其實就已經(jīng)落后了。好奇和相關(guān)肯定是來自第一線對這個產(chǎn)品很有感覺的人。如果找一個分析師,他對這個產(chǎn)品都不是很熟悉,又怎么能找到相關(guān)的東西?這就如同隔山打牛。
改變思考方式
但不可否認,大數(shù)據(jù)思考的精神是每一家公司都能用的,只要讓他們偶爾找到大數(shù)據(jù)的精神所在,就會有很大進步。
前段時間碰到一個B2C公司的CEO,我向他建議,今天下訂單的消費者,也許在十幾天前已經(jīng)在瀏覽網(wǎng)站,你為什么不收集這個消費者從注冊那天起,所看過的產(chǎn)品與最后購買產(chǎn)品之間的關(guān)系,為將來所用呢?
我認為,這個數(shù)據(jù)就是大數(shù)據(jù)思考的精神所在。其實,大數(shù)據(jù)并不是我們在聚光燈下看到的這么死板,而是要充滿好奇,不斷地自問,有什么數(shù)據(jù)(全新的或重新創(chuàng)造的)能夠解決今天的一些問題。
一直以來,由于數(shù)據(jù)獲取成本高,大多數(shù)商家都用假定沒數(shù)據(jù)的方式進行決策。而如今,要想具備大數(shù)據(jù)思考精神,必須先改變思考方式,假定這個世界能找到任何數(shù)據(jù)來思考你的問題。
而這一思考方式的改變,最重要是從管理層開始,如果沒有意識到大數(shù)據(jù)是個管理問題的話,做大數(shù)據(jù)是沒意義的。
企業(yè)管理層不要過度注意自己的事情,要把眼界打開,看到周邊的微信號和自己現(xiàn)在所做東西的一種關(guān)系,這是大數(shù)據(jù)的精神所在。具體點說就是,不要只盯著今天眼前的數(shù)據(jù),有些數(shù)據(jù)雖然放在路邊,但是它卻非常有用,只是你沒有看見,所以沒有把它用上。今天大數(shù)據(jù)使更多人知道,周邊數(shù)據(jù)比本身數(shù)據(jù)更重要。
如果大家相信我,就不要再說做大數(shù)據(jù),而是說用大數(shù)據(jù)的思考來運用數(shù)據(jù)。雖然公司有數(shù)據(jù)挖掘部門,但這些數(shù)據(jù)都是用來做營銷的,而這并不是大數(shù)據(jù)。
現(xiàn)在,我常常接觸的電商老板,已經(jīng)開始運用大數(shù)據(jù)思考,每天都講數(shù)據(jù),而這些數(shù)據(jù)就是大數(shù)據(jù)能夠給到他們的機會是什么。對于企業(yè)運營層面而言,不需要把數(shù)據(jù)分為大數(shù)據(jù)和小數(shù)據(jù),但是企業(yè)的決策層應(yīng)該有所區(qū)分。
例如,唯品會把自己BI團隊的員工打散在業(yè)務(wù)部門做輪崗,他們在業(yè)務(wù)部門輪崗六個月后再回到BI團隊。我覺得這個做法非常對,一個沒有商業(yè)感覺的數(shù)據(jù)分析師是廢人一個。
而銀泰網(wǎng)的CEO廖斌,現(xiàn)在天天在美國走來走去,看人家大數(shù)據(jù)在干嘛。對于CEO來講,應(yīng)該多一些對大數(shù)據(jù)的了解,通過思考讓企業(yè)更好地發(fā)展。
但公司的運營層面,要老老實實把公司里可以用的數(shù)據(jù)都用上,忌不吃碗里的,只盯鍋里的,用大數(shù)據(jù)的思考方式來找出一些以前沒看過的點。
大數(shù)據(jù)的新挑戰(zhàn)
當數(shù)據(jù)越來越復(fù)雜,大數(shù)據(jù)同樣面臨新挑戰(zhàn)。預(yù)計未來,當無線數(shù)據(jù)和電腦數(shù)據(jù)混在一起后,將是大數(shù)據(jù)的一大難題。
早上,你用手機看到覺得挺好的商品,點擊收藏,下午,你用電腦打開再看,那這個鏈條加起來后,你覺得以前電腦端講的漏斗還有效嗎?
所謂的轉(zhuǎn)化率都是假定存在于電腦發(fā)生,而如今,包括淘寶在內(nèi)的很多網(wǎng)站手機的訪問占比已經(jīng)遠遠高于幾年前了。當用手機和用電腦購買商品的用戶群混在一起,用什么方法證明購物體驗的好壞、轉(zhuǎn)化率的高低,都需要重新設(shè)定。
而無線所產(chǎn)生的數(shù)據(jù),與網(wǎng)站分析數(shù)據(jù)最大的差異是情景(Context),究竟是在百貨公司里搜索還是在機場里搜索,重要的是在什么情景下進行搜索,這是很重要的鏈接點。
除了無線數(shù)據(jù),線下和線上數(shù)據(jù)的關(guān)系,也會產(chǎn)生新的數(shù)據(jù)原材料和方向(Re-invent Data)。
在某些地區(qū),線上購物已經(jīng)極具影響力,線上的商家慢慢發(fā)現(xiàn),最大的競爭對手不是線上的競爭對手,而是傳統(tǒng)商業(yè)的線下零售商。
其實,1號店最大的競爭對手是離消費者三百米外的沃爾瑪。以前,線上購物用戶比較宅,他們更偏向互聯(lián)網(wǎng),但是現(xiàn)在線上市場已經(jīng)不是一幫鐵桿的互聯(lián)網(wǎng)用戶群,而是一群以前在線下購買,現(xiàn)在開啟線上購買的人,這才是所有電商公司正在爭奪的用戶群。
所以線上和線下這兩種數(shù)據(jù),變得非常重要。
例如,我看過亞馬遜的數(shù)據(jù)科學家的用戶檔案里,重點關(guān)注的是消費者首次/末次購買情況,購買的地理位置旁邊的數(shù)十公里范圍內(nèi)有沒有書店。因為亞馬遜知道最大的對手是線下書店,消費者喜歡逛,而線下書店可以提供逛的感覺,這就是競爭對手。
一直以來,互聯(lián)網(wǎng)用戶群是最核心的線上消費者,而現(xiàn)在被部分線下消費者稀釋了,所以現(xiàn)在的消費者更偏向瀏覽和逛,用戶的行為更寬泛。
事實上,逛的用戶習慣和傳統(tǒng)的線上購物習慣是矛盾的,傳統(tǒng)線上購物是先有目標,輸入關(guān)鍵詞,再選東西,但對于逛的人,根本不需要關(guān)鍵詞。這也是為什么淘寶要開始推逛的概念,這是一個趨勢。
看淡數(shù)據(jù)的得失
數(shù)據(jù)不會把一家公司救活,只有公司經(jīng)營的方向和理念,才會救活一家公司,數(shù)據(jù)只是錦上添花, 甚至有人說數(shù)據(jù)是用來幫企業(yè)調(diào)頭用的。
但大數(shù)據(jù)思考顯然不同,它并非錦上添花之用,而是將數(shù)據(jù)作為產(chǎn)品的原材料,產(chǎn)生一種新的商業(yè)模式。如果有人能想到,有些數(shù)據(jù)以前沒人關(guān)注,運用到商業(yè)中,可能會出現(xiàn)一個新模式,這才是大數(shù)據(jù)的范疇。
最近我一直都在思考,什么樣的團隊才可以管理大數(shù)據(jù),這個必須要想清楚。先想通人再講事,因為數(shù)據(jù)人才在中國非常少,在這種人才、管理經(jīng)驗都不夠的情況下,要做到很棒的數(shù)據(jù)是不容易的。所以在數(shù)據(jù)上,人才培養(yǎng)才是王道,在未來的一兩年會很重要。在目前這個浮躁的環(huán)境下,中國專業(yè)性的人才很難培養(yǎng)起來。
至于未來,因為大數(shù)據(jù)還沒形成一種直接動力,很難形成積累和利用的意識。對電商老板說,只能慢慢來,對數(shù)據(jù)不要失望,也不要太樂觀。今天,企業(yè)最難抓到的點是,如何在專注的領(lǐng)域里找到一些對企業(yè)有價值但是以前沒有關(guān)注過的數(shù)據(jù),這個數(shù)據(jù)如果能為我所用的話,會成為企業(yè)的核心競爭力。
【想看更多互聯(lián)網(wǎng)新聞和深度報道請關(guān)注速途網(wǎng)官方微信。(微信號:速途網(wǎng))】