歡迎光臨
每天分享高質量文章

《資料中的商機》吳明輝演講PPT全文

有人說,商業的本質盈利樣式只有兩個,一個是壟斷,一個是資訊不對稱。

而吳明輝點破DT時代的商業本質,“一切業務資料化,一切資料業務化。資料產品其實是加速實現和放大決策者在資訊不對稱中的收益”。

吳明輝說自己更喜歡“資料產品設計師”這一職業稱謂。談及產品進化,他毫無保留的指出:“將近80%的產品經理都認識到,大資料不能證實任何事情,只能證偽;大約10%以上的成熟產品經理領悟到,資料獨角獸公司在創業之初都是因為幸運的選對了場景;而只有1%的人能將既有邏輯清零,發現資料生意三要素以及它們如何變化促使機遇誕生”。無疑,明略資料、秒針系統這兩家資料企業級服務商就是這樣走向成功的。

下麵是明略資料、秒針系統創始人兼董事長吳明輝,以《資料中的商機》為主題系統分享資料產品化商業化的實踐和心得。

* 吳明輝,連續創業者,2006年創辦秒針系統,奠定中國營銷監測商業樣式;2014年創辦明略資料,帶隊研發行業AI大腦SCOPA系統,幫助公安破獲多起犯罪案件。

以下為演講實錄。

大家好!我是吳明輝,我創辦了兩家資料公司,明略資料和秒針系統,都發展不錯。

明略是透過資料提供支援分析決策的行業人工智慧解決方案提供商。秒針是用數學的方法將廣告投放效果抽象出來的營銷洞察提供商。

這十幾年的經歷,有很多值得討論的話題,今天我和大家聊一下資料商業化的實踐和心得,我會分享四部分:

  1. 對資料生意本質的認知

  2. 資料行業產品化商業化的核心思考

  3. 明略和秒針的價值增長案例

  4. 我給大家的一些建議

這些觀點都是我自己的歸納總結,也歡迎大家待會兒拍磚。

01 對資料生意的認知

資料的本質是什麼?

資料生意的本質是什麼?

資料產品的價值是什麼?

剛剛主持人介紹了,我是學數學的,很驕傲是中國最好的數學系,北京大學數學系畢業的。我今天的分享,就從數學、數學家講起吧。

《高等代數》、《解析幾何》、和《數學分析》是數學系大一的三門教材課本。其中高等代數對於非數學系的同學,應該叫線性代數。解析幾何我估計同學們上大學不一定學了,中學的時候應該都學過平面解析幾何,大學數學系學的是三維、四維更高空間的幾何,立體解析幾何、空間解析幾何。數學分析肯定大家都學過,非數學系學的叫高等數學,就是微積分。

數學是特別基礎的學科,所有的事情都可以用數學去理解,這三門基礎課程有著深刻含義。舉個例子,小學學的第一門數學課程叫什麼?算術。算術在數學裡面專業詞彙叫數論。數論是從哪裡出來的?就是數數。為什麼人類要數數?數數這個事情研究得越來越複雜是為了幹嘛的?其實是為了算時間。看太陽什麼時候升起落下,看月相陰晴圓缺都是為了算時間用的。

幾何是為了算空間、算位置用的。就像剛剛楊曉老師講的時空大資料,其實數學的本質就是研究時間和空間,是用XYZ、用12345研究時間和空間。時間和空間是我們研究每一個學科最核心的兩個維度,宇宙,宇和宙就是時間和空間。

數學分析研究的是函式和函式的變化,核心是研究變化。

這是數學最基礎的三門課。你要知道,時間是怎麼回事,空間是怎麼回事,變化是怎麼回事,這就是數學最基礎的東西。


對變化的研究,微積分分為微分和積分,這個和我們日常生活有很大關係。微分是不斷去研究一個個體變化,研究一個區域性、微觀的變化,就是個體研究。積分可以求面積、求體積,是求和用的,它其實是統計看宏觀的。數學的思想就是資料分析的思想,研究變化,研究微觀變化,研究宏觀變化。待會兒分享我們案例的時候,會分享資料生意是如何從這些方面去做研究的。


千禧年,我因奧數保送北大,北大2000級數學系已經有四位數學家了。照片中是其中的兩位惲之偉和張偉,去年剛在美國拿下科學突破獎-“數學新視野獎”。大家有沒有聽說過這個獎?很厲害的,有“科學界奧斯卡”之稱,2013年由俄羅斯億萬富翁尤里·米爾納設立,阿裡巴巴馬雲及其夫人,騰訊馬化騰、Google塞吉·布林,Facebook馬克·扎克伯格夫婦,以及蘋果公司董事長亞瑟·萊文森等知名企業家贊助。科學突破獎旨在表彰在生命科學、數學和基礎物理學領域做出傑出貢獻的科學家。有同學能夠拿到這種獎了,我也非常驕傲。數學界沒有諾貝爾獎,最高獎項叫菲爾茲獎,第二高的叫拉馬努金獎。這兩個同學都已經得了SASTRA拉馬努金獎,號稱中國菲爾茲獎的晨興獎也都拿了,我認為他們將來應該都能拿菲爾茲獎的。真的,我很榮幸能夠跟他們成為同學。

能夠拿那麼高階的獎,他們研究的課題是什麼呢?給大家看個公式,這個公式證明瞭一個很牛的猜想,函式域中的高階Gan-Gross-Prasad猜想,它連線了數論和幾何的兩個量,幾乎打破了這一領域30年來的毫無進展,為數學界著名的7個千禧年問題中的3個問題推出了諸多的解題可能性。


這聽起來很牛,那數學怎麼賺錢呢?資料怎麼賺錢呢?這其實是非常遠離的兩個方向。

先說數學,照片上左邊那位是我們年級數學最厲害的叫惲之瑋,大家都叫他惲神。我在讀書的時候已經是學霸了,中學時代只要我做不出來的題沒有人能做出來,每次考試數理化,尤其是數學,老師不是看我考不考第一名,只要不是滿分就讓我把卷子抄50遍,這是我的老師對我的要求,因為他覺得我不可能有不會做的題。

但是,我去了北大以後,遇到惲神,就是這樣一個對比的感覺,就知道差距了。為什麼叫神呢?我給大家舉個例子,在本科期間,惲神數學專業課19門100分,7門99分,其中不乏大一時便已修過的高階課程。不免要感慨一句,這樣的成績,我們可能只在小學一年級的時候考過。他在本科畢業申請到美國讀研究生的時候,只給美國前十名的大學寫了申請,後來只有前四名給他發了offer,第五名開始給他的回信都是:親愛的惲之偉同學,You are over qualified,反正你也不會來的,給你發Offer也浪費我們的資源。真是神一樣的人物,這是真正的學神,我只能叫學霸。

我在讀大學的時候,一直是蠻跨界的人,初中二年級開始程式設計,當年是數學、物理、化學、計算機,每一科都參加競賽,每一科都在前幾名,數學最好而保送北大。大一的時候,學校舉辦數學建模競賽,建模競賽和剛剛楊老師講的問題類似,也是需要設計一個模型再進行解釋。我當時就去找惲神,我知道這個人太牛了,國際奧賽金牌,我說:“惲之偉,你數學最好,我程式設計最好,咱倆組個隊吧,就天下無敵了。”我那個時候就表現出來知道怎麼去找正確的合作,因為我當時是數學系裡面程式設計最厲害的,我是我們系裡面唯一一個初中就開始程式設計的人,連續參加五屆計算機競賽取得大獎,其他同學連程式設計是怎麼回事都還不知道。惲神是我們年級數學最厲害的,我們倆組個隊那不是天下無敵嗎。然後他語重心長的跟我說:“明輝同學,我們學數學不是用來做應用的。”這充分的打擊了我,我也知道了跟神的區別是什麼,在他的腦子裡面數學就是理論不考慮應用。我告訴大家他到現在沒有微信,不用智慧手機,大家能想象嗎,如果我們聯絡他的話只能發郵件。我有好幾個在美國的同學都是這樣,只能發郵件聯絡,頂多發簡訊,這是真正的數學家。他們的物質生活是很辛苦的,大家看拿了世界級這麼厲害的獎,獎金十萬美金,數學家國家科研資助的錢也不多。數學離商業是非常非常遠的,真的是沒有什麼關係。

那資料如何賺錢呢?資料的價值是什麼?

今年春節我去了紐西蘭,中間有一站到了美麗的特卡波湖,去過紐西蘭的同學大都會去這一站,這是全世界最有名的觀星地點。這裡幾乎沒有什麼光汙染,晚上沒有雲彩的話就是這樣的景色,隨便一個單反相機,只要曝光時間長一點就能拍出清晰的銀河系。

看到一閃一閃的星空,我就想古人花很多時間和精力去研究星星,價值是什麼?

天文學家開普勒,提出了行星運動的三大定律,是現代宇宙理論的基礎。開普勒能做到是他很幸運地能夠得到著名丹麥天文學家第谷·布拉赫20多年所觀察與收集的非常精確的天文資料。


所以資料是什麼?資料其實是對世界觀察的一個數學記錄。

資料它的價值是什麼?是幫助那些沒有觀察的人解決資訊不對稱的問題。

因為每個人的時間都是有限的,你沒有時間去觀察星星,我看完記錄下來,等到開普勒需要計算的時候,把資料拿出來給他。再舉個例子,大家做金融風控,看一個家庭有沒有還錢的能力,以前你沒有時間和精力去看每一個家庭,今天有了大資料分析,基於這個資料表現出來他有能力還款,所以我可以貸款給他。每個人都需要資訊、資料解決類似問題,資料可以做很多事情,可以幫助科學家歸納總結、可以提出猜想假說,這是資料的價值。

資料跟數學還是有一點區別的,資料是客觀世界的記錄。

我的觀點是用資料做生意是一個悖論,我們上午討論提到各種案例資料不靠譜,我的觀點是一樣的,資料確實是不靠譜的。我為什麼認為資料不靠譜,資料做生意是一個悖論?我覺得資料和生意這兩個事從概念上就是矛盾的,資料是解決資訊不對稱的,生意本質是什麼?是利用資訊不對稱的。馬雲說一切資訊不對稱都會被網際網路顛覆,但事實上,他們自己成了資料壟斷巨頭。資料和生意怎麼放到一塊去,這看起來就是很矛盾的一件事,怎麼用資料去做生意它確實是一個問題。

商業的本質是資訊不對稱,怎麼解決資訊不對稱的過程中還去賺錢呢?舉個例子,解決廣告行業的資訊不對稱問題,以前有一些廣告公司透過低價買一些很爛的流量,高價賣出去賺中間差價,利用資訊不對稱賺很多錢,買方和賣方,賣方不知道誰想買我的流量,買方不知道哪個流量是好的。

秒針的出現顛覆了這個樣式,因為我們非常清晰透明的告訴大家哪個流量好,哪個流量不好。我們做收視率分析、做廣告監測,這個市場被我們徹底顛覆了,本來大家都能賺錢的現在都不賺錢了,我們雖然賺了一點點錢,但比它們少太多了。收視率市場,最近電視廣告一直在縮水,中國市場以前最高峰的時候大概有三千億,現在降到不到一千億了。

我們以前做網際網路收視率,不做電視收視率。電視收視率中國最大的公司叫央視索福瑞,在海外最大的是尼爾森,央視索福瑞一年的收入在中國估計是10個億,大家覺得也不少錢了。但是你知道黑產,做收視率刷榜那些公司一年能賺多少嗎?40個億。這個收視率刷榜怎麼做呢?汙染樣本戶。央視索福瑞是透過抽樣調查的方法來統計收視率的,一個城市比如說北京兩千多萬人口,抽樣1000個家庭,平時看什麼臺統計一下,最後預測,整個北京市大家都在看什麼臺。造假怎麼造呢?只要搞清楚這1000家在哪裡就行了。然後到他家裡說,我是某某衛視,如果你每天看我們臺,我一年送你50斤花生油。很多樣本戶就這樣被汙染了,1000戶裡面影響50戶就能讓收視率上來5個點,他一年收入可能就能多10個億。所以黑產其實是比做資料生意的公司本身賺得還多,用資料來去賺錢其實不是賺錢,是在破壞別人賺錢的機會,所以說這是一個悖論。


解決方法呢?確實也有很多人用資料賺了大錢。舉個例子,如果你把資料真的理解成為一個底層東西的話,實際上可以認為絕大多數商業都是在利用資料賺錢的,只是大家賺錢手段不一樣。商業是利用資訊不對稱的,資訊不對稱在我的觀念裡面分為兩種,一種是一次性的資訊不對稱,一種是持續且流變的資訊不對稱。

什麼叫一次性資訊不對稱?有人說某個股票要漲,這是一次性的資訊不對稱。你能拿這個資訊來做生意嗎?你告訴一個人,那個人馬上告訴一百個人,一百個人告訴一千人,這個資訊只能告訴別人一次,把這個作為一個資訊資料來賣是不靠譜的,因為他賣給一個人,其他所有人也都知道了。所以利用這種資訊來去賺錢唯一辦法就是你自己把這個股票買了。一次性的資訊不對稱這個事只要做完了就沒有了。

流動的資訊不對稱是有機會做生意的,每天這個事都在發生變化。比如說廣告投放每天都在發生變化,一個電視節目今天好看不一定明天好看,一個網頁今天流量大,不一定明天流量大,這些是每天都在持續發生變化的,是你可以去利用它做生意的。只有持續流動的這種情況,你才有可能利用資料做生意。一次性的資訊不對稱,把這個資訊用到最好就行了,就是自己悶聲發大財。

舉個例子,零售選址是一次性的問題還是一個流動的問題?我以前覺得這個沒有什麼商業價值。如果你開快餐店就看麥當勞,某個地方很好麥當勞已經在了,直接去旁邊開店就完了。如果做零售的話就看優衣庫和無印良品。我和他們的總裁交流過,他們選址方案非常牛,牛到什麼程度?在全世界每一個國家、每一個區域都是做的不同模型。這個模型是跟當地最牛的研究學者一起去做的,比如說在中國肯定會找北大去研究,在日本是東京大學做的。我看那個表引數都不一樣,精細化的程度研究到這個店在幾層,底下有幾層,地上有幾層,研究引數全部都放進去了,非常複雜。絕大多數人他自己沒有去研究,直接參考麥當勞、優衣庫的選址,所以,感覺選址沒什麼生意的機會。

但是我後來發現確實有公司持續透過選址服務賺到了錢。這段時間,我正好也研究了一下新零售,招了一位以前做新零售的高管。他給我講說,選址也是一個流動性問題,是天天發生變化的。我們有一個客戶是中國最大的便利店集團,有一萬家店,今年還要開幾千家,每年都要開幾千家店,但同時每年又都要關幾千家。他要不停的選,因為今天選擇了一個好地方,明天不一定好。比如今天在這裡開一個店7-11,明天突然旁邊有人又來開了一個物美,你的客流就被搶走一半。因為你周圍的環境在不停變化的,這件事情就變成一個流動的資訊不對稱問題了,它是有商機的。有些行業變化慢就沒有機會,有些行業變化快,你就有機會在這裡面去做生意。它不停的變,才有機會利用資料賺錢,它是有商業價值的,這是一個非常典型的例子。


所以我們要研究一下,把資料變成一個產品它的價值到底怎麼去表達出來呢?

我剛才講了時間很重要,空間很重要,資料我認為它是一個時間的朋友,因為時間是最值錢的。我們每個人的生命都是有限的,最寶貴的財富就是時間,如果你能幫助一個人減少時間浪費提高效率,就有機會來用它去創造價值,就有機會把這個資料變成一個產品去賣,所以資料產品價值其實就是幫助人來節省時間提高效率。

我把它分成兩個方向,第一個是資料創造信任,這也是秒針系統的slogan。信任的價值是什麼呢?降低決策成本。這是資料非常重要的一個價值,比如說廣告主打廣告,他一直猶豫這個廣告到底投不投,無法決策,有一天知道了秒針,他拿秒針資料一分析,或許這個資料的歸因分析還需要進一步完善,但是他已經對廣告效果的資訊有了更多的瞭解,就能做決策投吧。

秒針透過資料說這次廣告投得不夠、在哪裡投廣告效果特好,這就是秒針的可信的價值。其實這個資料是否全面是第二位的,第一位是它促使決策者快速做決策。沒有人是在瞭解百分百資訊下做決策的,他瞭解部分資訊他就去做了,這就是資料創造信任很重要的一個價值。因為很多事情你做了才知道對不對,一直猶豫不決,機會就喪失了。即使最後你失敗了,也是一個成功,不做是完全沒有價值的。所以資料創造信任,那個資料本身已經不是最關鍵的了,信任是最關鍵的。信任降低整個社會最核心成本,大量成本都是因為不信任產生的,有了信任我們整個社會效率就提升了,我們就有價值了。秒針這樣的公司是透過資料創造了信任,從而創造了很大很大的價值。

同學們上午都分享了很多例子,我從理論上幫大家證明一下,為什麼資料其實不一定是真的,甚至一點用都沒有。我前面寫了一句話,資料不能證實只能證偽,這是科學家首先要知道的第一件事情。如果你想讀博士,想當科學家,必須學一門課《科學導論》,這門課最核心思想就是說其實這個世界上沒有真理。有關這個觀點,還有一本書我推薦大家去看,通俗易懂的版本叫《世界觀》。

這個世界上沒有真理,任何大家覺得肯定是對的東西,都是透過嚴密邏輯推理的東西。邏輯推理裡面有三段論,第一段是前提假設條件,條件為什麼是對的呢?如果你要證明那個條件是對的,它又有前提假設,一層一層往下推,推到最底下那層推不下去叫什麼?叫公理。公理就一定對嗎?在平面幾何中“兩條平行線永不相交”。但在黎曼幾何中有一條基本規定是“在同一平面內任何兩條直線都有公共點(交點)”。在黎曼幾何學中不承認平行線的存在,它的另一條公設講“直線可以無限延長,但總的長度是有限的”。所以這個世界上沒有真理,所有的問題歸根結底推到最底下的地基都沒有人能證明,所以資料是證明不了任何事情的。但資料有一個重要的作用,可以用來證偽。比如愛因斯坦的相對論,讓天文學家發現水星在近日點進動的觀測值與根據牛頓定律計算的理論值存在一個每世紀43角秒的偏差得到合理解釋,同時證明瞭牛頓經典力學出問題了。它透過一個觀察記錄的資料證明這個事情是錯的。為什麼?因為這個世界每天都在產生新的維度,每天都在產生新的變數。

我家老大現在上小學二年級,經常會遇到這種題目,給以下數列找規律,寫下一個數是幾,比如說1357下麵的括號肯定是填9,我相信大家都會填9。但是,學數學的就知道,其實那個括號填什麼數字都行,只不過擬合出來的那個方程式是一元一次方程、還是二元一次方程、還是三角函式,什麼都能擬合出來的。你根本就不知道那個序列最一開始是什麼方程,是線性的還是非線性的,什麼都能擬合出來。所以過去證明不了未來。

我前兩天給我兒子講時間是怎麼回事。我給他講7天是一個禮拜,每年有12個月, 1月大,2月平,3月大,4月小,我說2月很特殊,為什麼叫2月平,因為2月有28天,我就給他出題了,哪一年的幾月幾號是星期幾,按道理應該能算出來,但是中間出現了一個幹擾叫閏年,不是每一年2月都是28天。你觀察一百年的時候,突然會多總結出來一個規律就是多久會出現一個閏年,再隔一千年的時候你會發現那個理論又需要調整了。前面講的小週期還是大週期,越大的週期會發現新的維度,新的變數,會不斷的發生。你會發現這個世界上沒有真理,資料不能證明任何一件事情,只能證偽,這是整個科學發展告訴我們的一個非常基本的道理。

數學推理和公理加在一起,有公理再加上嚴密的邏輯推理才能證明一些東西,但是你證明的只不過是一個命題或猜想而已。為什麼?因為一切都建設在那個公理上,邏輯推理那個過程是沒有問題的,但是你的公理錯了就全錯了,這是數學最基本道理。數學裡面專門有一個學科就叫《數學基礎》,不是叫基礎數學,數學基礎研究的就是這些東西。很多數學家都在研究這些底層的東西,有很多東西也是哲學問題。

既然資料是沒辦法證實的,但我剛才講了資料有一個很重要的價值是可以產生信任,為什麼可以產生信任呢?

我從控制論角度再給大家講一下為什麼,控制論也是現代科學裡面非常重要的理論,任何一個人做決策或者是一個系統向前推進過程中,有這幾個環節:感知、理解、決策,最後行動。

給大家舉個例子,飛機在機身上有很多感測器,平著飛,突然來了一陣風傾斜了一點,感測器就會告訴大家已經左傾了,這個時候它會自己調整,調整一下機翼的角度往右傾一點點了。這是不斷適應,不斷調整的過程,這是控制論的邏輯。

其實我們人做決策也是這樣的,大家每天都是去觀察,眼睛、耳朵、鼻子、身體的觸覺都是感測器,你感知到外界的變化,然後理解、思考最後產生行動。你的感測器它最後給你大腦拿回來的是什麼?就是資料。所以資料為什麼能夠增進信任呢?是因為人的大腦有一個重大Bug叫能不動腦就不動腦,這是心理學裡面很重要的一個結論。我以前是學人工智慧的,花很多時間研究腦科學和心理學,腦科學相當於大腦的硬體,心理學相當於大腦的軟體,所以這兩個東西都要學才能搞清楚人工智慧是怎麼回事。

人大腦最基本原理就是能不動腦就不動腦,感知系統要耗費你的能量,認知系統,比如眼睛把外部訊號翻譯成符號傳到你的大腦的時候,大腦再透過邏輯推理做決策也要消耗能量,這兩個都消耗能量。

有一本書推薦大家看一下《思考的快與慢》,這是一位心理學家、經濟學家、教授,丹尼爾·卡內曼寫的。他講人的大腦分為系統一和系統二,系統一是直覺系統叫快系統,系統二是邏輯推理的慢系統。

系統一是非常快的,耗能相對比較低,一個人每天日常的新陳代謝都是系統一消耗的。每天的運動根本不經大腦邏輯,你往前走可以自己調整得非常好,完全直覺就控制了。很多同學我估計大家經常開車回家怎麼開回去的都忘了,就是系統一在駕駛,實際上今天無人駕駛系統是一個系統一,它是一個直覺系統。

系統二是邏輯思考,邏輯思考這個系統很複雜。這個系統其實是人腦設計得不太好的,它消耗的能量很大,特別消耗體力,所以多思考是有助於減肥的。系統二思考的過程中是沒辦法並行的,系統一是可以並行的。你的左手和右手是可以並行的,比如說彈鋼琴左右手並行已經變成直覺了,你走路手腳都可以並用。系統二你會發現你不可能同時算兩道數學題,想要同時算兩道題那就是用計算機的方法叫中斷,第一題算一下然後中斷,算第二題,再中斷算第一題,沒有並行的情況,只能跳來跳去,所以多工處理是挺討厭的。大家都發現多工處理是人類重要的技能,但是很麻煩,很消耗體力、很消耗能量。

系統一是透過人的直覺系統,透過人的感知系統,把外界訊號翻譯成資料或者叫符號。什麼叫符號?人類的文字就是符號,數字也是符號,這些都是符號。我相信大家現在絕大多數的公司肯定都在做人工智慧相關產品。人工智慧在發展歷史上其實有兩個重要學派一個叫符號主義,一個叫連線主義。現在的深度學習就是連線主義。大量的工作其實是符號主義相關的工作,像知識圖譜,邏輯推理,機器推理這些東西。

什麼是符號主義,什麼是連線主義?連線主義其實就是人類的直覺系統,你看今天講的機器視覺CV演演算法,人臉識別相當於在模擬的眼睛。現在大家眼睛望著我,相當於你身體上的兩個攝像頭,攝像頭拍了一段影片,但是你腦子裡面絕對記不下這個影片,這個影片內容太長了,資訊量太大了,最後你腦子裡面只記下了“吳明輝”,這三個字就是一個符號。今天你的眼睛把這段影片翻譯成了吳明輝這三個字,你的耳朵是把我剛才說的這些話翻譯成了文字,後面聽到音樂的話變成了旋律。其實你是在把資訊量很大的訊號最後轉變成了資訊量很小的濃縮的符號,這是連線系統、人類的直覺系統最核心做的工作。這些符號最後在大腦系統二裡面再連線一下,在上面進行邏輯推理,有了底層符號有了語言這些東西才能在上面做邏輯推理。還有一本書也推薦大家《人類簡史》,現代智人為什麼這麼牛,就是因為現代智人有了語言系統,有了想象力,有了邏輯思考能力,這些系統底層架構是什麼?就是符號。沒有符號邏輯沒法推理,邏輯本身就是符號,所以這就是連線主義、符號主義。

我想給大家闡述一個道理,從心理學上,為什麼資料可以產生信任?人決策的整個過程是,先感官系統翻譯外部訊號變成符號,第二步再把符號進行邏輯推理加工有個決策過程,產生最後的決定,最後行動。第一步第二步都消耗能量,可信任的資料可以直接讓決策系統繞過第一步,直接進入第二步,直接給第二步提供了符號,加速了人類的決策。比如秒針說這三個媒體,第一個媒體CPM更便宜,第二個媒體CPM特別高,第三個媒體全是作弊的,這是秒針的報告…你覺得秒針挺靠譜的話,你就不會再動腦思考一遍這個數是怎麼算的,邏輯是怎麼回事,你就直接做決定了。因為你自己已經有了這樣一個決策系統,秒針說CPM低的而且不作弊的我就去買,這是你的決策系統你的系統二,系統一是秒針幫你完成的。人腦重大的Bug就是你不去判斷這個資料產生的過程是不是對的,你就會相信這個資料,因為大腦就是能不動腦就不動腦,這是一個最基本的原理。所以從心理學角度來講,有數字給老闆彙報,就比沒有數字更容易獲得老闆認同,這個大家應該都可以理解。但前提是什麼?你要搞清楚他的決策流程是什麼,他的決策邏輯是什麼,他的方法論是什麼,基於它的方法論給他這些Input。資料本身可能沒有用,但就因為這些資料是可以讓領導者快速做決策,它的價值是非常大的。

我給大家講一個故事,也可以認為是一個笑話。在東北有很多土匪,有個電視劇《烏龍山剿匪記》,後來有很多研究表明,那些土匪都是特別信算命的。有一些學者就去研究,發現有一個特別神奇的事情,就是不算命的那些土匪最後都沒了,都被剿滅了,或者說都散夥了。最後再去邏輯推理一下為什麼,發現一個有意思的現象,凡是算命的哪些人每天都會算一下,今天應不應該下山去搶劫,Yes就下去搶了,No就不搶了,這是一種情況。另外一種情況土匪是不算命的,每天都下去搶,搶到最後的情況是什麼呢?彼此質疑,誰也不信誰的,所以他們就只能散夥了。所以我想說的事情是什麼呢?算命這個事情和大資料道理是一樣的,只是讓決策者更快的做決策,讓你覺得有用,實際上不一定是真實的依據。

還有一個例子,前兩天我去紐西蘭,麥盧卡蜂蜜是紐西蘭著名特產。我從網上找了幾張照片,瓶子上面有些數字是10+, 16+,20+,每一瓶蜂蜜上都有這個數。這個蜂蜜號稱有一個賣點,就是治胃病。在紐西蘭超市我看到上面寫的26+,一小罐蜂蜜標價2600紐幣,相當於一萬多塊錢。這時候銷售就過來介紹,先生你看這個蜂蜜特別好,為什麼?可以治胃病,因為這個蜂蜜有一種非常重要的麥盧卡植物提取出來的成分,成分含量不一樣而有不同的數值,成分越高治療胃病效果更好。如果你現在剛做完胃部手術,要買20+的,如果你曾經犯過胃病現在沒什麼大事了買15+就行了,如果一直都很好你買5+、10+就行了,它們之間的價格差別是什麼呢?基本上每加一個5價格就加倍。

那天我為我的岳父買了很多。在這個過程中,我想告訴大家這個數字對我來講特別重要,包括對我岳父也很重要,因為他覺得吃了這個蜂蜜胃就會好。但是你說這個測量,測得一定準嗎?我想未必。但是它確實能起到這樣一個非常有意思的效果,讓你快速做決定,短短幾分鐘你就花了幾千紐幣買了很多蜂蜜回去,這就是資料產生的價值。如果能學會使用這樣的資料產生這樣的價值,你一定會賺錢的。

好了,我再說資料第二個價值。畢竟我也是搞科學出身的,所以我給大家從科學的角度解析一下,資料實實在在一個很重要的價值,它確實可以減少人類的試錯成本。

人類所處周圍環境是不斷在發生變化的,這個變化對於每個人都是商機,如果你把握住了變化規律你就可以去賺錢。咱們產品營上一期的劉煜同學,他做了一個可以查房價的APP兔博士。他說之前他嘗試做過一個事情,每一個小區房子都有兩個價格,一個是報價,一個是成交價。這個報價可以從哪裡看?去58同城,安居客,賣二手房掛出來的價格就是報價。但是通常成交價都不那個價格,這個房子說一千萬最後賣可能是一千三百萬賣的,也有可能是八百萬賣的,成交價如果高於報價的話就說明這個小區要漲趕快去買,成交價如果低於那個報價就說明這個房子要跌。成交價從哪裡弄,房產局那裡能查到,但也未必能找到一定準確的,最後你要去看成交價和報價之間的差是怎麼變化的。所以這其實就是一個國內選房子看小區比較簡單的辦法。如果你一旦能夠預測變化的話,確實這裡面賺錢的機會就有很多。

前面說了預測是不準的,歷史不一定能夠證明未來,資料只能證偽不能證實。為什麼只能證偽不能證實?是資料太複雜了,經濟環境太複雜了,有大量因素就是如果我們把這個房價最後變成一個f(x)的話,有多少維度呢?可能是一萬個維度,可能是一千萬個維度。大家都聽說過蝴蝶效應吧,可能一個莫名其妙的小事情,一隻南美洲亞馬孫河邊熱帶雨林中的蝴蝶,偶爾扇幾下翅膀,你家小區房價漲了一倍,有這個可能的。有一本書叫《複雜》我強烈推薦大家去看一下,裡面講的就是這個話題。

《複雜》那本書最後一段講了最重要的一個課題,世界是複雜的,但有一個現象是什麼呢?這個世界絕大多數情況是連續的。雖然複雜,人類對長期的未來很難預測,但是短期未來是可以預測的,也就是說昨天、前天、大前天、前面一年的情況,預測明天、後天是有可能準的,但是預測一年以後可能是全錯,所以這是一個重要技巧。大家炒股的話,程式化交易高頻交易其實在用這個道理,就是短期可預測,長期不可預測,這是複雜性系統講的一個現象。而且複雜性系統背後的數學原理到今天都是這個世界上沒有解決的數學難題,真的是解決不了,到現在為止我的那幾個同學也解決不了。但它背後所揭示的這樣一個現象很有意思,很多事情變化是連續的,你非常快速去做交易是可以賺到錢的。

分析變化裡面你既要分析宏觀變化,也要分析微觀變化,宏觀變化就是我剛才講的透過觀察宏觀趨勢是可以預測未來的,但是你也別指望它能夠預測很久的未來,只能預測短期未來,因為未來是不確定的,隨時都有可能會出來一個新的引數。舉個例子比如說國家政策調整對於地產行業。前面做得再好都沒有用,隨時都可能產生一個新的引數你怎麼可能預測呢?但是特別短的時間可以做這件事情。微觀價值是什麼呢?這裡面特別重要,我給大家好好講一下,微觀的價值是用於比較的,我們需要按照各個不同維度去細分,細分到最下麵然後去看個體和個體比較,這些比較一旦比出來就會發現這裡面有最佳實踐,大家應該都聽說過一個故事:

這個事情從邏輯推理是推不出來的,你也不知道這個道理,但是你透過比較個體是可以尋找出這裡面的最佳實踐的,這就是微分的價值,這就是數學分析的價值。

就像剛剛講的選址問題,動態定價的問題,你確實掌握不了動態定價,但是你有很多方法或者周圍其他人曾經定過價去參考他,看誰定得好,誰賺得錢多,誰定得最好,你透過不停的比,最後就能夠掌握最佳實踐,這件事情是非常非常有價值的。

1990年,傑裡.斯特寧被國際慈善組織派到越南去解決越南兒童的營養不良問題。但發現沒錢、沒人、沒資源。並被要求半年之內做出成績。很多人建議他寫份報告就回美國。告訴組織,越南需要先發展經濟,然後發展教育,母親們的素質提高了,孩子的營養問題才能解決(這就是正確的廢話,生活中到處都是)。斯特寧沒有這麼做,他拿著尺子下了鄉。經過測量,選出了家裡又窮身體又健康的孩子們。然後去調研,發現這些孩子家裡都吃四頓飯,媽媽會去稻田抓小魚小蝦給孩子吃,還把番薯葉的汁淋在飯上一起蒸。於是斯特寧在村裡帶著母親們一起做飯,就用這幾招。6個月後,當地65%的兒童營養問題得到改善,並持續下去。

這種解決問題的思路就叫做“尋找亮點”。人經常會喜歡把焦點放在負面的問題上進行分析,得出一大堆不能成功的理由。這就是正確的廢話。只有找到亮點,並且認真分析,才能找到改變的正確方向。

為什麼說時空分析很重要呢?時空分析也是這個價值,大家都知道孫正義的投資理論,叫時光機理論。因為全世界不同地域上的經濟產業發展是不平衡、不均勻的,所以有的地方會領先。美國比我們發展得快,美國是最佳實踐,你就可以參考過來。這背後有一個假設是什麼?歷史總是驚人的相似。如果這個假設前提是對的,你就可以這麼乾。

不同城市它的發展也是不一樣的,比如我開一個餐廳,我是肯德基,我有一萬家,哪個餐廳經營得好,哪個餐廳經營得不好,我經過微觀比較,可以把經營最好的那個餐廳店長拉出來給大家講一講你到底是怎麼經營的,這就是數學分析的一個方法。而且這種分析其實是可以創造一些新的方法的,創造力是來自於群眾的。其實肯德基CEO也不知道怎麼最好的經營餐廳,有一萬個店長在實踐,經營好的人講一下為什麼經營得好,經營不好的人給大家講為什麼經營得不好,這麼一比你就知道怎麼做更好了,所以資料分析透過時空比較是可以幫你尋找最佳實踐的,這是一個非常重要的價值,節省你做業務決策的試錯成本。你本來是要亂試的,但是經過比較你會發現有一些方向不用試了,這就是它的價值,在這裡面創造的價值是資料的價值,是資訊的價值,你可以把它變現了。


宏觀,比如說國家每年都要做人口普查。整個IT產業之所以能發展起來,其實就是因為人口普查,當年美國做人口普查的時候花了很多錢,他是請了幾百名騎警,拿著打卡器,路上看到一個人按一下,把美國所有的地方都跑一遍。大概花多少時間呢?七年,就統計了一下美國到底有多少人。

中國現在每十年做一輪人口普查,國家統計局每年都在花很多時間忙這個事情,右邊這個網站是我們給國家統計局做的叫“國家資料”,涵蓋中國幾乎所有核心的經濟資料。國家需要利用這些資料去做決策,它要去比較不同城市,不同的小區的經濟情況,人口的情況,要做各種各樣的比較,比較完了以後去做決策,到底這個地方是不是應該再多修一個醫院,這個地方是不是應該多修個機場。

人口普查是去算不同單位上各種各樣的經濟資料,能夠帶來極大的價值,修錯一個機場可能幾百億就沒了,所以這個事值得做。你分析出來的變化,它所產生的影響越大你資料分析的價值就越大,它可以耗費的成本就越大。所以古人為什麼要夜觀天象,它影響很多事情,影響農業生產,要去分析農作物的播種收割,甚至還影響到政治。所以資料記錄一定背後要有一個動機才可能產生記錄這個資料的成本,因為記錄真的要很多精力很多成本。

我剛才舉了一個統計層面的資料,微觀層面的比較就更多了。比如說精準營銷,上午大家都討論了,人群畫像靠不靠譜,千人千面投不同的廣告靠不靠譜。其實包括我們去抓壞人這件事情,也是一個微觀的事情,要微觀分析這個人是好人還是壞人,它也有很多價值,這裡面也是減少試錯成本。為什麼?我走在大街上看到每一個人都像好人,警察不是,警察走在大街上看到每一個人都像壞人,我爸爸原來就是警察,他經常一眼能看出一個人是壞人,但是有時候他判斷會出錯的,資料分析可以幫助他驗證一下,資料可以幫他證偽的。中國警力是遠遠不夠的,又有很多案子要處理,只能先處理那些大案要案。所以你能透過資料幫他證明一個人是好人或者是壞人,這個時候就幫他減少出警的成本,對他的價值是很大的,他一個人可能就頂三個人了。這個和我們精準營銷的道理是一樣的。同樣的廣告費能不能給更多的標的群體。所以本質上明略和秒針的生意是一回事。

我總結一下,資料本身其實是沒有價值的,大家不要指望著直接賣資料賺錢。資料價值是來自於什麼呢?是你看到這個資料之後所做的後續的決策價值,如果你看到這個資料之後是做國家決策,比如修機場,這個資料就很值錢。如果看到這個資料最後決定明天早上吃肯德基還是麥當勞,這個資料不是特別值錢的。資料的價值,或者一個資料產業的價值,完全是取決於這個資料產業所應用的場景。

我也做天使投資,有一次有個師弟就跑過來說:師兄我現在有一個特別牛的創業專案希望投一點錢給我,免費停車。他想把停車場包下來,把收費系統全部改成NFC掃二維碼的電子化停車收費系統。掃二維碼可以免費停車或者打五折,我說你這個虧錢,他說我可以利用大資料賺錢,可以採集很多停車大資料,他說你看有車的人都是有錢人。我問這些資料拿回來能幹什麼?他說還沒有想過,好像APP流量也不少吧可以賣廣告吧。我就幫他算賬一天會有多少日活,一個CPM多少錢,按照全北京最貴的廣告位去賣,一個CPM多少錢,算到最後他就回去了,然後就不乾這個事了。

所以我見過無數的公司拿一個商業計劃書就說我這個樣式很牛,免費樣式最後產生大資料很牛,大資料就值錢,大家千萬不要信,資料不一定值錢。資料要放在真實的商業環境裡面,商業環境要有真實的價值,我剛才講了很多的環境,哪怕你去幫人賣蜂蜜都是有真實的價值,如果你想當然的認為有資料就一定能賺錢這絕對不是的,絕對是一個假說、是一個猜想。

上一次有個老師給我們講過產品經理的一個重要的公式,大家應該都知道,產品價值 = 新體驗 – 舊體驗 – 替代成本,這個公式是寫得非常深刻。具體聚焦在資料產品上面,它的價值公式應該是什麼?這裡面總結了一下,決策者在使用你的資料產品之後,應該會提前瞭解到變化,資料產生的價值就是讓你提前瞭解變化以後,它可能針對自己的業務節省成本或者產生新增的價值,這個其實是資料產品的新體驗減去舊體驗得出的結論,當然還要減去替代成本。這個替代成本不要小瞧,替代成本可能有時候不是正數可能是負數。資料這個行業有的時候資料成本是在降低的,一個新的方法有可能成本比原來還低,替代成本是一個負數,你一減負數還變正了。我們不斷去最佳化資料產品價值的方法論,要麼把前面的數變大,要麼把後面的數變小,最好是負數,所以這就是資料產品的產品公式。

資料產品的標的就是要加速實現和放大決策者在資訊不對稱中的收益。加速也很重要,這個資訊你瞭解得越快越好。像秒針所在的行業收視率領域。最早的收視率是用日記卡做的。就是家裡面給你一張卡片,每天晚上看完了電視,像寫日記一樣在卡片上記錄都看了哪個臺。這個卡一個月來收一次,收回之後再統計十天,最後就知道了上個月收視率是怎麼樣的。

大家知道98年中國最火的電視劇是什麼嗎?《還珠格格》。這個電視劇的收視率是什麼水平呢?40%,一百個家庭有40個家庭在看。但是那個時代收視率統計是延期一個月,那個電視臺賣廣告也沒賺多少錢,他根本就不知道原來這麼受歡迎。買了這個電視節目的廣告主就賺到了,沒買到的廣告主,本來可以提前知道很有價值的,就虧了,也是一個重要的商機就虧了。誰提前感知到這個變化,就是有價值的。後來這個統計方法被收視測量儀替換掉了,就是給你家歌華有線之外再裝一個機頂盒,用那個機頂盒看電視,每一次換臺都會透過電話線傳到它的資料中心,可以實時知道收視率的變化了。同樣,這個資料因為樣本量太小而太容易被汙染了。

所以加速瞭解資料變化是有價值的。秒針在廣告領域解決了這個問題。網際網路做監測,而且精準廣告更是這樣,每個個體都是在做調整的,每個人都可以看不同的廣告,所以它能產生很大的價值。

小結:

1. 數學在商業裡的價值是什麼?資料的本質是什麼?

  • 數學最基本的價值: 是人類從定性到定量、模糊到精準過程的思維和計算工具。數學分析是對“變化”的研究。

  • 資料的本質是利用數學觀察、記錄、理解世界。

2. 資料生意的本質是什麼?

  • 用資料做生意本身是悖論:資料是解決資訊不對稱;商業的本質是利用資訊不對稱賺錢

  • 解決方案:基於流變的資訊不對稱賺錢

資訊不對稱分為兩種

  1. 一次性的資訊不對稱:用完一次,就不能再用這個資訊不對稱賺錢了。

    適用場景:悶聲發大財(一次用到最好)如:利用獨家資訊炒股。

  2. 持續且流變的資訊不對稱。如:零售選址。

3. 資料產品的價值是什麼?

節省時間,提高人類效率:

  • 資料沒法被證實,但能創造信任、降低決策成本

  1. 這個世界沒有真理。資料不能證實,只能證偽。數學推理+公理,再加上嚴密的邏輯推理,證明的不過是命題和猜想;但一切都建立在公理上,公理一旦有一天不成立,就全錯了。

  2. 在控制論的感知-響應閉環(感知-理解-決策-行動)中,當機器將感知的資料呈現出來,人類便可快速決策響應。

  • 資料對萬物“變化”的分析可減少試錯成本

  1. 宏觀 – 統計趨勢,預測未來

  2. 微觀 – 較個體不同,尋找最佳實踐

4. 資料產品價值公式及標的

  • 資料產品價值認知:資料本身沒有價值,價值源自資料產品引發的後續行為的價值

  • 資料產品價值公式:資料產品價值 = 決策者提前瞭解變化所節省的成本和新增的價值 – 替代成本。

  • 資料產品標的:加速實現和放大決策者在資訊不對稱中的收益

02 資料生意三要素:資料行業產品化商業化的核心

資料源、人、資料應用的場景

剛才講的控制論角度裡面,有一個很重要的模型叫感知-響應模型,從感知一直到最後的響應和行動,感知、理解、決策和行動,這中間有三個非常重要的要素。

第一,感知出來的結果是什麼?就是資料,感測器收過來的是資料。

第二,理解和決策裡面有一個很重要的主體是什麼?是人,是Decision Maker或者是一個分析師在理解和做決策。

最後,還要行動,決策和行動其實要一個特定的場景,不是我一個人拿著資料什麼都能幹的,要有一個特定的場景來去行動。

我稱這三個要素是資料商業化三要素,資料源、人、還有資料應用的場景。

這三件事情哪一件做不好,資料都商業化不了,你要有好的資料、對的人,對的場景。很多情況下像我們剛才那個同學說這個資料怎麼回事,後來一聽他連最基本廣告的原理都不知道,給他資料他也分析不對。中國很多中小企業之所以用不了資料軟體,因為他的公司內部就沒有懂這個事情的人。

很多網際網路公司以前絕對不可能買秒針的產品,但是你看今天它們都買了,因為它們都成了大企業,滴滴、美團、頭條全都買了秒針的服務,它們的規模越來越大,請的人越來越專業,一旦專業了以後就會用專業的工具做分析,以前它規模小的時候根本沒有人能做分析,所以人很重要。最後要有明確使用這個資料的場景,你別自己瞎編一個,那是不可能的。

所以資料生意的機會一定是在這三個要素中間,某一個要素或者某兩個要素發生巨大變化的時候,才會有新的創新機會。為什麼?所有的生意都是連續的,別人原來在這個行業裡面做得好好的,憑什麼你今天突然殺出來。原來像尼爾森、索福瑞做收視率做得好好的,為什麼今天突然殺出來一個秒針給它們顛覆掉了?一定是這個產業裡面一個要素、兩個要素甚至三個要素都發生了重大變化,這個時候你才會有創新創業的機會,才會有我們做出很牛公司的機會。這個機會有多大呢?還是我剛才說的,背後的變化決策的場景規模有多大來決定的。



比如頭條也是一個資料公司,解決的是什麼呢?是消費者閱讀新聞看內容,跟搜尋引擎是一樣的。其實,我在創業的第一篇商業計劃書寫的就是希望給這個市場上不同的人推薦不同的資訊,我的研究生論文寫的就是這個方向,結果當時的市場不Ready,就做成了秒針,上次在開學典禮上也講了這個故事。初衷一樣,但企業的價值就不一樣了,原因是什麼?各自服務的場景背後的價值是不一樣的。全人類獲取內容的價值肯定遠遠大於廣告的價值,廣告只是其中的商業內容,而頭條解決的是所有內容,所以它的價值當然要比我大。明略則服務一個更大的市場,政府。

一個資料公司價值是由什麼決定?由你所服務的那個行業價值決定的。所以資料行業有些公司比我們賺得多,比如說做股票軟體的就比我們賺得多。大家都知道彭博社,萬德資料,大家炒股的時候可能也會去看這種軟體,它們是更賺錢的。所以你所服務的產業有多大,在這裡面乘以一個百分比應該就能夠得出你公司的價值了,這就是資料商業化。大家千萬不要手裡面很多資料最後選擇錯誤的方向,一定要選擇正確的行業,所以選擇場景是資料商業化最核心的。

而且每一個場景裡面都要有一個核心決策的問題,這個問題要決策需要一些資料,你只要選對了,這個決策又很有價值,你就可以去商業化了。

舉個例子阿裡巴巴是不是資料公司呢?它當然是資料公司,為什麼那麼值錢?它是一個大家想買商品的場景,每個人都想買東西,尤其是女生每天都有特別強烈購買慾望,女性消費者想買東西的時候,她的關鍵決策,她希望什麼呢?希望物美價廉,好且便宜。所以她需要的資料就是證明產品和產品之間在物美價廉、差異化變化的資料。所以你可以看到價格,看到照片,這些資訊陳列給你,其實是幫助你做決策,到底該不該買這個商品,這就是資料價值。而且這個資料一定是流動的變化的,價格是天天變,商品也在天天變,所以它有巨大的商業價值,中國整個零售交易額有多大,線上交易額有多大,就可以推出來阿裡巴巴到底有多少錢了,非常大的市場。

今日頭條都不用說了我已經舉過例子了,很大的價值,秒針就比較苦一點了,比它們小很多。但是秒針的場景也很重要,在座的同學們大家要打廣告,你看到我的資料就敢付錢了。在付錢的時候,是基於我的資料判斷是不是該扣媒體的錢,還是下次多投一點,就是看到之後有一個非常明確下一步的任務。所以我們的收費標準很簡單,就是客戶投入多少錢在裡面收一個百分比,待會兒可以告訴大家這個百分比肯定會越來越小的。

SAP企業內部的ERP系統,這個資料起到了什麼樣的作用?管理作用。像IBM Watson在美國輔助醫生做診斷等,每一個資料產品都有它的價值。比如說墨跡天氣,有非常明確的價值,你每天出門之前的穿戴選擇,是非常明確的場景,我就是要知道出去帶不帶傘,出去帶不帶口罩,就是判斷這兩個資訊,你看的就這三個數,PM2.5、還有降雨機率、溫度,其它的數其實對你來講不重要,不是關鍵決策,且這個資料一定是流動變化的,不是穩定的,如果每天都一樣你就再也不用這個APP了。

前面我說了資料價值是怎麼產生的,經濟學裡面講價值和價格是兩回事,價值和價格之間的差距由什麼來決定?由供需來決定。如果供不應求的時候你的價格可以很高,如果供過於求你的價格就不會很高。因為你有價值,很多東西價格戰打到最後就沒有錢了。比如說百度很有價值,但是我們在座的人用百度搜索都免費,因為它不敢收錢,為什麼?它的邊際成本是零,你多一個使用者和少一個使用者對它來講幾乎成本不變,所以它真的不敢收錢,因為有競爭。大家想想,資料類的產品一旦有競爭就沒有收錢的理由,因為它的邊際成本零,就意味著你可以無限降價,這就是為什麼網際網路樣式一定要免費,因為絕大多數產品就是資料類的產品,一旦面臨競爭就只能降價,降到最後就是零了。乾脆像周鴻禕學習我就是零了,反正使用者給黏住了,除非還有什麼人搞補貼,那就不行了。如果沒辦法把所有人都吸引到產品上後面再去賺錢,就只能一直打價格戰,所以《從0到1》裡面講的這個太經典了,只有壟斷才能產生利潤,在任何一個細分市場裡面必須壟斷,不壟斷不要想有機會產生利潤。硬體為什麼有機會產生利潤?是因為它的邊際效應不是零,它的硬體本身是有物料成本的,這個成本有很多情況下不透明,這個時候你就有機會在裡面去賺錢了。所以我偶爾會羨慕那些做硬體的同學們,不至於特別慘的價格戰,做軟體太慘了,基本上都要打成零,你只能靠其他方法去賺錢,所以只有壟斷才能產生利潤。

壟斷剛才講了商業化三要素,你壟斷什麼?是壟斷資料源呢?還是壟斷使用資料的人呢?還是去壟斷場景呢?沒有壟斷是產生不了利潤的,到底壟斷什麼?我想告訴大家我自己的觀點,我做了這麼多年資料產品,我認為壟斷場景更重要而且也更容易。壟斷資料幾乎不可能,壟斷人更不可能。客戶自己還有人呢,客戶除非一點人都沒有,才有機會把市場上能分析使用這個資料的分析師壟斷下來,那太難了,人怎麼可能壟斷呢?!資料源為什麼壟斷不了?因為資料源隨隨便便就可以Copy走了。資料的安全保護太難了,而且資料源一旦是一個靜態資料,賣一次所有人都知道了,資料也很難壟斷。而且資料還有一個很重要的特點,它可以互相推理,我雖然沒有你這個資料,但我有一個你的前置指標,我的資料可以推出你的資料。舉個例子,假設大家是做旅遊的,旅遊資料最好知道這個人怎麼買火車票買機票,有了以後就可以做攜程、去哪兒,但是你沒有這個資料沒關係,如果有運營商基站的資料也可以,你看到這個人去火車站了、去機場了,兩個小時之後跑到了另外一個城市的火車站就可以推理出來他坐火車去的。這個世界上資料太多了,資料和資料之間是可以互相推理演繹出來的,所以你沒辦法壟斷資料,資料一複製就是兩份邊際成本是零,你沒辦法壟斷資料。

但場景可以壟斷,因為所有的場景是有固定的預算。比如說一家企業一年賺一個億可能拿一百萬出來買資料,這個預算是不能複製的,如果給服務商A就不能給服務商B,不可能每家都買。如果每一家都買的情況是什麼呢,就是試試哪家靠譜,之後發現一個靠譜就只會給一家了,所以場景是可以壟斷的,因為預算可以壟斷。

因為用資料的人手裡面可以用來買資料的錢是有限的,這個錢不能複製,給了A就不能給B了,所以這件事情可以壟斷。這個道理其實就證明瞭為什麼今天網際網路公司會出現巨無霸的情況,今天如果把阿裡巴巴所有的商品資料全部拿到,所有的賬號全都拿到,會再做一個新的阿裡巴巴嗎?絕不可能了,你有資料有什麼用,消費者根本不在你這裡選商品,阿裡巴巴壟斷了消費者選商品的這個場景。京東為什麼同時存在而且都賺錢了?其實是因為他們在做兩個不同的細分市場,阿裡巴巴的主要使用者是女性消費者買衣服,我就沒有支付寶賬號,我買東西只去京東,因為我特別受不了一下子出來10個到底選哪個,我一定要選擇最簡單的樣式,京東一搜只有1個我就買了,特別簡單。所以它是兩個不同的細分市場,分別在兩個不同細分市場壟斷了才能產生利潤,否則一個資料產品一個資訊產品不壟斷沒有機會盈利的。這個細分市場壟斷可以以不同的行業,不同標的群體,甚至是不同區域。

壟斷資料產品的場景工具是什麼呢?就是品牌。有品牌才有機會。舉個例子今天大家去買東西,女生買東西就去淘寶天貓,男生可能去京東。為什麼?大家都已經信賴這個品牌了。今天大家去投廣告結算的時候,就會找秒針的資料來看,我們已經成為這個市場中壟斷的企業了,因為這個品牌信任都到你這裡來了。所以品牌建立了之後,資料產品是有機會在一個場景上壟斷,大家看天氣預報你不會到處不停的去查,你會看看墨跡天氣、天氣通,就這麼一兩個已經形成的品牌。學品牌的人大家都知道,消費者大腦裡面每一個品類只會記住一兩個名字,這一兩個名字就壟斷了資料場景,就有機會賺錢了。所以品牌是很重要的。

那這個品牌是怎麼誕生的呢?你會發現有新的品牌源源不斷誕生,是因為這個行業出現了重大變革,這個變革其實就是我前面講的一次性不對稱,不是那種流動性不對稱。舉個例子,當年秒針的發展。我們發現市場上核心需求已經不是電視廣告了,很多客戶希望把電視廣告投放的預算挪到網際網路,我們就自己做了一個產品幫助客戶做預算分配。我們給客戶提供了一個資料工具,告訴客戶怎麼把電視的錢投到網際網路,在網際網路上怎麼分配,這就是我們這個產品的核心價值。因為當時產業裡面出現了重大變革,網際網路崛起,出現了網際網路廣告,而這件事情,尼爾森等公司沒有跟進。我們抓住了這個機會,建立了在電視和網際網路之間分預算的一個產品,進而所有人想做這個事就找秒針,就形成了平臺。基於這樣一個一次性不對稱的機遇,最後變成了在這個市場上的一個品牌,且我們每天處理的資料都是流動性的不對稱,所以才能持續性賺錢活到今天,也很不容易的。

前面講了場景的價值,大家可以理解這個場景越大越好,越大就越有機會賺錢,但是不是大你就一定能賺錢呢?不壟斷是沒有機會賺錢的,必須壟斷一個場景。所以大家都知道為什麼資本運作很重要,壟斷很重要。所以線下業務為什麼比線上業務對於創業者來說相對好做,因為地皮是可以壟斷的,這塊地是你的,馬雲來也沒戲,馬化騰來也沒戲,你壟斷了你就可以圍繞這個地做只屬於你的生意。線上不是,線上所有的流量沒法壟斷,很容易出現馬太效應。所以場景一定要選得越大越好,一定要製造壟斷,不製造壟斷你就沒有機會贏,這是資料類產品,資訊類產品的一個特點。

另外一個機遇是什麼呢?一個是場景重大歷史變革,另外一個是資料成本的突然變化,也可以創造資料生意的機會,資料源其實是經常容易發生變化的,很多新的資料源會誕生。

再說秒針所在的市場調查行業,我們也叫消費者洞察行業。全世界最大的公司叫尼爾森,我印象裡一年應該是不到一百億美元的營收,看它的財報,每一百塊錢收入,大概會分三個部分。第一個部分叫獲取資料的成本,這個以前是幹嘛的呢?就是去發問卷。比如說剛才講的收視測量也是發問卷,日記卡也是發問卷,幫助一個客戶調查消費者喜不喜歡他的產品,也是要發問卷的,各種各樣的行業都需要發問卷。收入一百塊錢裡有四十塊錢用來獲取資料。第二個資料分析成本,五十塊,資料分析成本其實是人的錢。他要花五十塊聘一個分析師人把這個報告解讀一下,給你講清楚,講完了以後如果你覺得很滿意就付他一百塊錢。最後十塊是它的利潤。所以這個行業利潤率不是特別高10%。這個過程中大家肯定希望十塊錢的利潤部分越大越好,都希望把四十和五十盡可能降低。這是有機會降低的,秒針就在做這個事情。

為測量電視收視率部署機頂盒成本是非常非常高的,機頂盒還經常壞,為避免樣本戶被汙染還要不停的變,所以花的成本是很大的,索福瑞一年收入10個億,裡面可能要花3、4個億去換這些機頂盒,這個成本是很高的。大家回過頭來看秒針,做網際網路就沒有這個負擔,我們就是把一個程式碼,可能是一個SDK也有可能是一個Tracking Code,放到大家開發的這些APP或者網頁上面就可以追蹤,沒有硬體成本,我們唯一硬體成本是後臺的機房。

我算兩百臺伺服器,我們公司其實就是一個雲端計算公司,在做這個業務之前雲端計算這個詞還沒有出來。我是在2006年底創辦的秒針,當時我在實驗室裡面學的方向叫分散式計算,連雲端計算這個詞還沒有呢,但做的就是雲端計算的事。用幾百臺機器同時幫客戶去算廣告的效果,沒有那麼大的資料獲取成本,而且這個成本在持續降低,因為伺服器越來越便宜,頻寬越來越便宜。而尼爾森發問卷是人發出去的,人越來越貴,我的利潤越來越多,它的利潤越來越少,最後我一定會顛覆它的。資料分析成本全部都是人,而今天秒針已經花很多資源來去研發,怎麼用人工智慧去分析資料,這一塊也可以最佳化,所以都是機會。

資料挖掘的過程有收集、儲存、檢索、分析、推薦、最後形成整個人工智慧,形成智慧。中間每一個環節都會產生成本,每一個環節也都可以透過新的方法去最佳化它的成本結構,不停的降低資料分析的成本。如果你有新的成本結構就可以去顛覆這個資料行業,這就是資料的生意,它的生意就來自於這些,而且這個模型就是控制論裡面的感知-響應模型。

感測器在市場上是會不斷發生變化的,整個硬體行業每天都在推出新的產品。一般有新的感測器就意味著有新的資料了,所以我對感測器是很敏感的,一直都在觀察市場上有什麼新的感測器,有新的資料就可以嘗試去顛覆某幾個用原來那些資料的行業資料產品,所以這就是機會。

比如說我現在做的幾個行業。

安防行業,明略所在的行業,這個行業最大的新的感測器,就是原來也有但用得不好的攝像頭。現在滿街滿城都是攝像頭,攝像頭取代原來的感測器是人的眼睛。以前滿街都是警察站崗,現在不用了,攝像頭比人的眼睛成本低多了。一個攝像頭才多少錢,家裡面的攝像頭現在才兩三百塊錢一個,安防產業裡面用要經得起風吹日曬的也就兩三千一個,比人便宜多了,所以它是一個重大的變革,所以安防產業誕生了一大批新的公司利用這個新資料來去解決問題。

廣告行業,秒針所在的行業,就是因為出現了網際網路出現了監測程式碼SDK等等,取代了原來的收視測量儀、日記卡,我們拿這個資料又便宜又快,而且不是抽樣的是全流量的,直接把原來的資料源給顛覆掉了,顛覆了就有機會。

移動網際網路,大家會看到很多公司原來在做網際網路的時候,默默無名或者就是一個普通的公司,但是到了移動網際網路的時候突然間就牛了。比如美團大眾點評,沒有移動網際網路的時候它就是一個普通的公司,今天突然就牛了,為什麼?移動網際網路相比於傳統的PC網際網路不光是可移動,傳統的PC網際網路我也可以拿筆記本到處移動,因為移動手機上有好幾個新的感測器叫攝像頭、GPS、還有麥克風,這些感測器以前在PC時代都是不常用的,或者是做得很爛的,而這些感測器使得整個資訊釋出、資料採集,各方面全都發生了重大變化,產生了新的資料類產品、資訊類產品的機會。

所以大家每天要關註下一代手機上面還會加什麼東西,一旦加了一個新的東西,都會有機會,有時候不是這個硬體加了,有可能它只是效能提升了,可能都會有機會。今天手機計算能力越來越牛才出現了像王者榮耀這些遊戲,是因為它可以掌控更多的計算。為什麼今天可以去做人臉識別,美圖最佳化,原因很簡單,也是因為鏡頭越來越好,CPU越來越強了,所以這些變化都會產生新的資料生意的機會。

我們每天都在關註這些事情,所以物聯網是需要特別關註的,因為物聯網有可能產生很多很多新的資料,會改造很多行業,未來會有大量資料生意的機會。大家可以關註自己的行業,怎麼利用最新的感測器去改造,當然前提是你有能力去改造,你如果只是很小的公司,沒有能力去影響這個行業的話,也做不到這件事情。

資料是加速迭代的,加速感知-響應模型迭代的,我們其實是更快的產生資料,更快的產生精準資料,資料越來越多,越來越好,迭代的速度越快,這個資料的價值就越大。我剛才講了一個月縮短到一天,縮短到實時,它都會產生很大的價值。就像廣告行業,廣告行業裡面剛才大家講RTB實時競價,一百毫秒之內就可以把一次複雜的廣告交易競價競完了。相比以前,以前中央電視臺廣告競價是每年一月份,競拍拍出去一百多億、兩百億,一年一次。今天肯定是比中央電視臺拍賣要大的,因為它是實時的,在這裡面做資料就可以產生很多生意。

但是這個迭代的過程始終都是有人的過程,一旦有一天感知-響應的過程裡面沒有人了,這個時候就是最快的迭代了,這個時候就是人工智慧時代了。人工智慧時代就是在控制論這個系統裡面感知-響應到最後,整個環節裡面把人都給顛覆掉了,全自動。而且這個全自動不是簡單的自動化,以前自動化也可以全自動,以前清華就有一個專業叫自動化控制,是考分最高的學生才能去的,以前自動化控制是人工編一個規則告訴它怎麼控制。未來的人工智慧是什麼呢?是自適應的,邊控制邊調整自己的演演算法、規則,不停的調整越來越牛,最後形成一個人完全沒有辦法顛覆的方案。今日頭條就在不停的調整新的推薦演演算法,是機器人去調不是人在調,你的資料沒有它多,你的演演算法也沒有它多,使用者場景都不在你這裡,後面的公司再也沒有機會超過它了,所以這就是今日頭條為什麼今天這麼牛。

這個迭代速度會產生巨大價值,迭代的終極就是人工智慧。今天早上,我還給我的高管分享了一篇文章,講美團和滴滴打仗的事。為什麼美團要去做打車的業務我其實特別能理解,大家想一想你作為一個美團點評的使用者,在辦公室裡面或者是家裡面搜附近的餐廳,過一會兒就決定去那裡吃飯了,路上打滴滴的車過去了,到那個餐館就吃,中間被滴滴給隔斷了形成不了一個閉環。只有你把打車做了,閉環才會形成,你才會不斷的完善最佳化,不斷去迭代,所以它是為了實現自己的資料閉環不得已做這件事情。他不做滴滴就要做,肯定他們倆最後會打起來,這就是一個感知-響應的過程,一個閉環的過程。

小結:

1. 資料商業化三要素:資料源、人、資料應用場景

2. 要根據資料商業化三要素的變化做產品創新(場景最關鍵),才有可能做成獨角獸

  • 資料變化。

  1. “感測器”和資料源的變化

    安防行業:攝像頭取代人眼

    廣告行業:監測程式碼和SDK取代收視測量儀

    移動網際網路:攝像頭、GPS的出現和不斷最佳化

  2. 資料儲存計算連線的成本降低。

  • 人的變化。越來越多的企業客戶懂得用“資料”輔助決策,且需求也在變化。

  • 場景變化

  1. 場景要大。應用場景對應的市場規模越大,越有可能誕生壟斷場景的大公司/獨角獸

  2. 定義核心決策問題。每一個場景裡面都要有一個核心決策的問題,這個問題要決策需要一些資料,你只要選對了,這個決策又很有價值,你就可以去商業化了

  3. 場景才是資料產品的核心,要壟斷場景(工具:品牌;品牌誕生於行業重大變革–一次性不對稱)

重要:感知響應速度的變化。任何資料企業都希望建立自己的感知-響應閉環。感知響應速度加快,資料加速迭代,資料價值越高,最終形成“沒有人能超越”的人工智慧,誰最先建成閉環,誰就能搶先壟斷場景。

03 秒針和明略的價值增長

企業級獨角獸的成長秘籍

前面給大家講的是我利用資料做生意的一些心得體會,最後稍微解讀一下我自己兩個公司的資料生意。

我剛才給大家講的都是我事後的總結,我第一天做的事情根本沒有想那麼多,挖掘是誤打誤撞做出來的,運氣。今天總結一下,一家公司它之所以能活,能賺錢是有一定道理的。

先說說秒針,秒針今天在中國能夠很好的服務這麼多世界五百強的企業。咱們說場景很重要,我在秒針發展這十幾年裡面,也一直在嘗試做小B業務,最後總是失敗。我訪談了很多企業家也都做不成小B生意,我想就是場景的問題,你的場景本身太小了。

有一次我看到了一個報告才恍然大悟,這個報告當時統計了全球IT花費預算,全世界TOP2000企業,花掉了全世界IT預算大家想想是多少?90%。如果這2000變到20000大家猜一下?對,99%。那個數字可能今天已經變了,但趨勢是說明問題的。你做小B有機會嗎?他們根本不花錢買服務,那些小B每天都是在生死線上掙扎。所以你看美團也好,阿裡巴巴也好,之所以在小B身上能賺錢,不是因為他在給他們提供一個服務,而是他們決定這些小B有沒有客流,他們其實是一個房地產商,你做這個生意不管死活總要交費的,同樣的道理,不管死活做生意總要買地租房子的。百度買關鍵詞也是這個道理,在阿裡巴巴上面開店也是這個道理,所以它們幾家做小B能賺錢是因為他們決定了這些人的生死,或者說這些人生生死死,死的人佔90%,活的人可能都不到10%,所以它做小B能賺錢。但是絕大多數軟體服務公司,像秒針和明略這樣的公司,不是決定它們生死的,是它自己已經活下來了,有一些事不願意乾,讓你來幫他乾。我們企業服務最大的競爭對手就是客戶自己,是客戶經常想著自己乾。所以只有特別大的公司,最後發現自己僱傭人乾太貴了,不如外包給專業的企業級服務供應商價效比更高。美國市場對於企業級服務供應商能稍微好一些,美國是因為大家招人都招不到,有錢都招不到。

因為地緣關係,外國大公司的生意很難拿。為什麼尼爾森能賺大錢,是因為剛才講的TOP2000的公司總部都在美國,它天天陪著這些客戶。尼爾森的總部和寶潔的總部都在辛辛那提,是挨著的兩棟樓,兩個公司的高管天天都坐在一塊,你跟它搶生意怎麼可能搶得過它。我們只能靠近寶潔中國總部,但是中國的生意也不是那麼好拿的,做營銷可以,但做IT系統,你看寶潔最後哪個中國的公司給他做IT系統了,幾乎不可能,都是總部統一採購,然後每個區域市場去應用就行了。

比如說資料庫,全球統一採購Oracle,每個地方都一樣,因為它是管理智慧的產品,HR系統、財務系統肯定是全球採購,但是營銷系統我們可以做,為什麼呢?因為營銷是每個市場自主決定的,因為每個市場面對的消費者不一樣,文化不一樣,廣告樣式不一樣。那些老外坐在辛辛那提總部都不知道中國該怎麼弄,只能中國CMO自己做決定。所以區域的廣告費是每一個區域的CMO自己決定的,廣告費最後花給了中國本地媒體,所以分析廣告費的系統也是這個CMO決定的,也就有機會給一個本地供應商了。

所以秒針是市場上,我不能叫絕無僅有,但是是非常罕見的一個中國公司居然服務了那麼多世界五百強企業,還不少賺錢的供應商,技術供應商,軟體產品供應商。是因為我們做的是一個本地可以自主決定的業務,因為有這樣一個場景,我們才有機會這樣做,否則你想都不用想,肯定是美國公司在做。所以中國有很多的比如說ERP公司、CRM公司,CRM公司我們公司也用,我的兩個公司都用的銷售易,其實如果讓我回答為什麼用它呢?是因為它便宜,比Salesforce便宜,這是唯一的原因,它距離Salesforce還有很大差距。10個秒針這樣的客戶,都頂不上一個去買Salesforce的客戶花的那個錢,而且我今天已經是成規模的,一年也不少賺錢的公司才花得起這個軟體的。所以不是那麼簡單就能去做企業服務,你要思考你做的這個品類,所在的場景有沒有機會壟斷,你的核心優勢是什麼。

我去做營銷,營銷核心決策是什麼?就是我剛才講的整個從感知、理解、決策到最後行動這個過程中,核心決策是什麼?其實這個核心決策有很多模型,又要建模了,這個是5W模型,其實還有什麼5P模型,5C模型,最新有一本書叫《營銷4.0》寫的是5A模型,基本上所有的資料分析都要基於這些模型挖掘出來。資料創造信任,你要先知道決策者他腦子裡面的方法論是什麼,如果他信5W就給他產生5W的報告,他信5P你就給他5P的報告,他信5C就給他5C的報告,你出的這個報告只要契合方法論,你這個資料他就有用,就可以幫他提高效率,就幫他更快一些,你就可以去賺錢。

秒針誕生的時候,市場主流的模型是5W,我們當時就幫他去解決誰,講什麼,透過什麼渠道,對誰說的,效果如何等等。我想說其實我們公司也挺偉大的,因為你們花了廣告費,所以你們產品才有機會賣出去,如果你們不花那肯定賣不出去,是吧?

這個是秒針的價值增長曲線。我剛才講資料產品的價值是跟它所面對的場景的規模、場景的價值不斷變化的。秒針歷史上的市值在不斷上漲,就是因為所在場景的價值越來越大。從第一天我們做的是一個產品叫AdMonitor,幫客戶去監測網際網路廣告,這是在2007、2008年開始做的這個產品。後來我在2009年的時候參加一個會,碰到一個老外,這個老外我到現在都找不到他,但是我特別感激他,他是我人生裡面重要的貴人。他給我畫了這麼一個框,說你們做的這個事情特別牛。其實秒針不是第一家做這件事情,市場上已經有一家公司叫Double Click。這家公司後來被谷歌30億美金給收購了。那這家公司其實是全世界最早的做廣告分析,網際網路廣告分析的,而且以監測Click為主。那我們當時跟他做的事其實是一樣的,但誤打誤撞多做了一件事情,因為Double Click出來的太早了,是1998年的公司,我們是2006年底成立,2008年才做這塊業務,已經是他十年之後了。十年之後發生了一個什麼重要的事情?就是摩爾定律,硬體成本在不斷的下降。在十年之前的時候,他只敢在伺服器上存click的資料。大家都知道一個廣告,他在網際網路上第一步先是展示,第二步才有可能點選的,展示是點選的多少倍呢?今天展示是點選差不多一千倍,平均一千次展示才會有一次點選,那個時代相對點選率是高的,一百倍,因為那個時候大家都沒啥可以點的。但是即使一百倍十年前也太貴了,伺服器太貴了,應用太貴了,沒有人敢存這麼多數的,因為資料真的很大,我們的這個資料硬碟不停的都在加,很貴的,一天是大幾個T的原始日誌的。從第一天上線資料量就很大。Double Click所以那個時代他就只存click,而秒針我們就屬於膽子大的,從第一天都不知道那個數能幹嘛呢,就先把它儲存了,曝光的日誌都存下了,也就是說一千倍的那個數都存下了。因為當時確實有機會存了,確實越來越便宜了,硬碟便宜了。

一旦我們存下來之後呢我就可以去追蹤每一個ID的歷史行為了,大家想一想,每一個人都在歷史上發生什麼樣的變化,這個時候其實我們就可以去推測他的興趣喜好了。當時我們都沒有做特複雜的,我們就把這個人群分成了幾類,比如說我們當時就用IP地址庫分了一下,這個人是高校的,這個人是網咖上網人群。我們怎麼判斷網咖上網人群呢,就看這個IP地址是一天24小時都在不停上網的。辦公室的IP地址很容易判斷,白天上網的就是辦公室上網的IP地址,只有晚上上網的是家庭的,24小時都上就是網咖。我們就把人分成了這幾種,非常簡單粗暴。我們當時比Double Click就多了一個功能,就是告訴廣告主,一波廣告打下去,這幾類人分別是多少,就這樣去搶我們的這些客戶。

那我後來去給這個老外講的時候呢,其實我本來都沒想那麼多,但是那個老外說,你這個東西太好了,電視廣告就是這麼評估的。電視廣告是沒有click的,電視只有曝光,只有曝光肯定不行的,收視率一個最重要的概念叫GPRP每收視點成本,就是我們要去分析,比如說這個產品是賣給老年人的,我要分析老年人的收視率是多少,不是分析所有人的。但是在Double Click那個時代沒有人能分析出來,因為他都不知道這個人是什麼樣的人,他沒有存下來這個人以前的行為,他只能去統計一個總量。所以這是秒針誕生的第一天,因為硬體成本的不同,使得我們有機會存下歷史資料,有機會做出一點點差異。但是這一點點差異啟發那個老外,那個老外說,OK,電視就是這麼做的,他說我建議你乾這麼一件事情,你把電視和網際網路聯起來,用GPRP,不要再去什麼檢測click了,電視怎麼統計出資料的你在網際網路上就怎麼統計,他說這樣一個最大的好處,你可以幫助所有的廣告主把電視預算往網際網路行業移,因為用統一衡量標準了。

這件事情是我們公司最核心最核心的資訊不對稱,他告訴我了,然後我們做了這麼一家公司就成了,因為從那之後,中國的所有的網際網路公司每天廣告費能收多少全部看我們的資料,然後所有的廣告組合全都用這個工具分配,不斷的把電視廣告往網際網路上移。這個產品到現在都是全世界領先的,所以我們可以去全球化,原因很簡單,就是因為我們產品是全球領先的,就是那個老外提醒我的。

所以當時他就給我畫了這麼一個圖,他說你看,網際網路在左下角的一個框裡面,在那些人裡面去分預算,是吧?那是個小錢,你要去把電視,更大的預算往那個小框裡面去挪,這是大錢,他就給我講了這個道理,所以我們最後這個產品就成了。後來又出現了移動廣告,又出現了數字電視廣告,我沿著這個道理,不斷的把這個框做的越來越大,市值就在不斷的生長。

長到一定程度以後發現到天花板了,我是在幾年前就發現我們到天花板了,後來我又做了一個業務的拓展,開始去搶尼爾森市場的生意,他們不僅僅是在做廣告的分析,他們同時還在幫客戶做營銷的其他領域的分析。廣告行業背後的學科叫Media,就是媒體的投放,媒體的購買。Media在一個企業裡面一般會有一個市場副總裁或者CMO負責。CMO手裡面管的預算不僅僅是怎麼花錢打廣告,還有怎麼花錢做PR,還有很多其它的事。CMO下麵通常有很多路徑,甚至有一些公司的客戶關係管理CRM都是CMO在管。CMO還有一個很重要的工作叫消費者洞察,瞭解消費者到底怎麼想的,不僅僅是怎麼打廣告的問題,這是全球最大的市場Agency他們在做的,他的預算是比單純打廣告的費用要多的。所以後來我們又把這個資料分析的場景繼續延伸,擴到了更大的方面,又拿下了更大的場景。

這就是秒針的市值增長的過程,這個過程就是我們在服務的場景不斷發生變化的一個過程。那這裡面的資料到底產生了什麼變化呢?我前面講的,因為以前是電視收視率的抽樣的機頂盒,而今天有了加碼的技術,後來還出現了爬蟲的技術,透過網際網路的爬蟲,就像百度一樣,把微博,微信公眾號,各種汽車論壇,各種各樣的垂直論壇裡面所有的討論全部抓抓回來,可以告訴客戶消費者到底怎麼討論你的,怎麼想的,怎麼討論你的競品的。而這些資料以前只能透過發問捲去問,今天可以透過爬蟲的方法拿回來,這個比原來的成本低太多了,這又是一個資料的機遇,又是一個資料的變革。因為有了這些變革,所以我們才能幫助廣告主更快、更直接的做出這些決策,而且這些決定決策是對的。也有可能是錯的,但是無論如何,讓他產生了更強烈的信任,然後Take action,這就是秒針的價值。

明略,明略我們其實是在四年前成立的。在那個時間點上,我是不斷的思考秒針這個生意怎麼變得更大,後來我有一天想,我們一直是做大B的,最大的B是誰?不就是政府麼。我當時就看到一個什麼樣的歷史機遇呢?就是在政府的這個場景裡面的一個重大的歷史機遇是什麼呢?在那個時間點上正好爆發了斯諾登事件,這就是我們的機會,就是因為這個事情我創辦了明略。

在斯諾登事件之前,我剛剛跟大家講了,政府也要有IT預算,IT採購,他的IT採購從哪買?政府領導一定是買最好的,最成熟的,也就是最貴的。誰是最好的,最成熟的?肯定是Oracle,IBM,SAP他們的產品,所以沒有中國公司的機會。但是斯諾登事件出現了之後,中國政府開始講資料安全問題了,要支援自主智慧財產權的軟體產品。這是一個重大的歷史機遇,所以我們就創辦了明略,面向政府做業務。

那為什麼後來做公安做成了?因為在政府裡面公安是對安全要求更高的,這個行業都不光是說中國政府買不買美國的產品的問題,是美國人做出來產品人家都不賣給你。大家都知道,IBM是全球做這種政府軟體做得最多的,做得最好的,他曾經在公安市場裡面收購過一個英國軟體產品公司,叫I2,那個產品做得非常好,但是不賣給中國。後來中國透過臺灣的代理,都買到了,但很多都是破解的,反正各種問題。所以這個系統一直都沒有特別牛的公司做出來,我們進到公安系統,你會發現整個公安市場上全都是各種小公司,收入幾百萬的,一兩千萬的,上億的公司都已經很大了,明略在這個行業裡面都算是龍頭型的企業了。

這個場景體量很大,整個公安的軟體系統絕大多數都是資料系統,而這些系統在整個公安系統一年的IT預算是幾百億,上千億的規模,如果算上硬體是幾千億的規模,大家都知道每天都在部攝像頭。今天出現了中國公司的機會,我們有機會在這裡面成為老大,所以我就毫不猶豫的趕快去做就行了。其實在做這個之前我們業務一點都不懂,就是到處學,學美國公司怎麼做,學IBM怎麼做。矽谷有一家非常有名的公司叫Palantir,這個公司也是讓我做決策為什麼最後做這個方向的原因,這家公司是當時我在整個資本市場看到的所有的軟體技術公司裡面市值最高的公司,一度到了300多億美金。一個沒上市的公司,300多億美金。後來也證明一件事情,融資也簡單,所有的VC過來看了之後,他說你們這個業務很像Palantir,我說我們就是對標他的。然後回去IC彙報的時候,說明略就是中國的Palantir。

那明略所面對的這個資料的機會的是什麼呢?我剛剛講了,就是攝像頭等,各種各樣新的資料源的誕生。其實裡面還有一個機會是什麼呢?就是這些資料之前是四分五裂的,沒有聯絡的。網際網路本來就是四分五裂的,後來因為有百度,有谷歌,把這些資訊都聯起來了,有超級連結把大家都聯起來了,那今天移動網際網路仍然也存在這個問題,不知道將來誰能徹底解決這個問題。這些都是機會,誰能夠把這些資料聯起來,降低人使用這些資料成本。降低資料成本方法有很多,一個資料本身產生儲存有成本,資料的使用,挖掘的過程也有成本。

一個警察,他以前要破一個案子,要在100個系統之間來回切換的,他先查查這個人以前有沒有犯罪記錄,再查查這個人的車有沒有違章,查來查去,等他查通了把情報搞清楚了,可能一個月之後了,那個人已經跑了。

今天有了明略的SCOPA系統,我們把這些資料全部都連線到一起,一個系統全部搞定。當然了,很重要一點,是因為今天確實一個系統能把這些資料都存下,因為資料量也很大。我們把這些資料編製到一起的時候也做了非常精妙的一個複雜的東西,我們把這些資料做了很好的壓縮,可以把最髒亂差的原始資料提取出來真正有用的資訊,最後壓縮成知識,知識是價效比最高的資料,知識是密度最高的資料。大家想想,一個人體有多少資料,一個人裡面應該有很多資料的,人怎麼產生的呢?我們的父親母親,就那麼一點點的DNA資料產生一個人。人體整個基因程式碼只需3GB就夠了,相當於是一個人的程式,那個程式一直Run下去就變成了今天的你了,非常神奇的一件事情,那個東西我們稱之為知識。

各行各業背後都是有方法論的,都是有知識的,這些知識其實是濃縮度最高的資料。我們是把公安系統的所有的資料最後都整合壓縮成了公安系統裡面最核心的符號系統,我們叫人、事、地、物、組織,有好人,有壞人,有事件案件,有地址,剛才講的空間,有這個娛樂場所,辦公場所,家庭住址。然後物,大家的手機,汽車,這些都是物品,這些都是跟破案相關的,我們把所有的這些資料最後全部都關聯壓縮到系統上,建立知識體系,最後把公安所有幹警腦子裡面破案的戰法也都放進去,全都變成知識體系,最後他就形成了一個決策系統,他可以真的幫助公安破案,非常非常的厲害,我們已經產生了很多的戰果。

這套系統我今天就不仔細講了,因為今天也不是講AI的專題,我們還是多講講資料。

明略的價值的增長其實是另外一個維度了,就是我們所在的不是簡單的場景,場景其實一直都是在圍繞政府的,場景沒怎麼變化,明略創辦第一天的時候本來不是想做一個完整的解決方案的。創辦第一天的時候只是看到中國市場有政府大資料的機會,我們當時就做了一個大資料平臺MDP發行版,因為當時看到了Cloudera挺好的,就做了一個Hadoop發行版,想做一個類似於Cloudera的公司。做著做著就發現不對勁了,這種軟體的競爭太激烈了,你會發現這個門檻並沒有那麼高了。我們這個團隊出來的第一天的時候,它的門檻還是很高的。開始的時候,我們這個團隊是從秒針出來的大概20個人,這20個人原來是在秒針處理Hadoop叢集,處理大資料的團隊。

在這個市場上,比秒針資料量大,處理日誌量大的公司其實只有BAT,或者說秒針跟BAT是一個量級的,都不能說他們比我們大,因為我們是橫跨所有的網站,所有媒體上的廣告監測,這個資料量太大了。後來我們發現,越來越多人會用這個工具,之前只有秒針的人出來會用,所以當時很多的客戶買我們的系統,隨後,用這個東西的越來越多,會用的越來越多,而且開源的軟體升級的越來越完善。最一開始可能開源軟體只能做到60分的水平,我們因為是一個原來用過這個軟體的人,我們可以把他完善成85分出去賣。後來你很快發現過了半年那個軟體自己變成80分的水平了,再過半年他已經比你做得還好了,因為全世界幾千個優秀的工程師一起在維護這個開源軟體。

所以我剛剛說的,軟體類的產品,資訊類的產品,資料類的產品,一旦充分競爭,因為你的邊際成本幾乎是零,最後一定會陷入價格戰,最後就沒有錢可以賺。因為這個原因我們就不能去做這件事情了,需要換別的方向了。而換別的方向的時候,我們就發現一個最大的問題,如何幫助客戶去使用這些資料是更有價值的。選擇了公安行業不僅是幫他做一套平臺,存這些數,而是幫助他們把這些數真正用起來,能破案,所以後來我們就做了幫助他破案的這套系統SCOPA。

在這套系統建立的過程中又發現了一個問題,就是遇到了剛剛講的資料產品商業化的三要素其中的哪個要素呢?是人的問題。我們發現我們做出來的系統最優秀的警察用他破案非常厲害,但是普通的警察根本就不會用。所以我們就開始想做人工智慧,能不能讓他普通的警察點兩下也都破案了,最好啥都不用想,能不動腦就不動腦。所以是因為人的原因又再調整我們的產品方向,到今天其實我們仍然在不斷的迭代,不斷的嘗試。也是因為我們逐漸的能夠形成閉環了,所以公司的價值在不斷的增長。

所以,應該說資料產品的商業化的過程是很痛苦的,因為你光有資料沒用,光有場景也沒用,很多很多的公司都是死在最後你做出一個好的產品沒人會用,因為你會用不代表你客戶的人會用。大家看起來中國人數學都挺好的,但是真正一用發現都不會。或者大家很多在用的過程中都有問題。

分享一個我們自己的產品破案過程的影片。

大家可以看到,這就是一個正常的公安局破案研判的過程。這個過程其實裡面的資料源是非常多的,就是來自於各種各樣的系統。以前沒有我們這樣的產品的話,他去調這些資料,基本上複雜的案子要一個月。大家都知道為什麼有些案子一破要一年,因為實在是證據太多了,資料太多了,很多警察就看那個對帳單就看到眼花,經常都把幾個藥店的眼藥水全買光了,就是這個水平,所以非常辛苦的。警察是非常非常辛苦的,我父親原來就是警察。

我們在做這些研判的過程中最大的價值就是把原有的所有的資料都關聯起來,裡面所有的人、事、地、物、組織全部自動的識別出來,就像我們的人的眼睛一樣,你把外界的所有看到的這些訊號全部處理成符號,最後在你的大腦那匯聚,最後再去做邏輯推理。

而剛剛大家看到這個研判的過程大家還覺得挺複雜的,是吧?這個使用者體驗不一定是最好的,那為什麼?就是今天這個操作介面是一個很優秀的警察可以在裡面這麼複雜的去做研判。那後來我們也發現了,普通警察確實搞不定這個事情。所以今天我們還在做一個非常非常創新的一件事情,就是可以把剛剛的這種過程可以錄製下來,其實就相當於,大家可以理解為就是AlphaGo的一個棋譜。AlphaGo是什麼呢?就是在一個巨大的數裡面去搜尋一個最優的一個路徑,是一個搜尋問題。破案就是一個搜尋問題,我從最一開始的報案的原始的情報,一直搜到最後的犯罪嫌疑人,再搜到他今天的軌跡,也是一個搜尋的問題。所以優秀的警察他會用這套系統,他會不斷的沉澱棋譜在上面,用的人越多,我們把中國的最優警察全部都放上去,都用了,這套系統就越牛,他最後在後臺就會沉澱出一個不叫AlphaGo了,是Alpha Police,全世界最牛的警察。而且他會越來越牛,沒有人再能趕上,這就是這套系統的本質。

所以我們利用這種類似的方法論在幾個行業都可以去做這件事情,這就是明略今天做的事情,我們用他來去保衛我們每個人的人身財產安全。我相信社會會越來越安全的,因為以前警察真的是不夠的。我記得,印象特別深刻,我在讀研究生的時候我丟了一臺膝上型電腦,然後我就去北大燕園派出所去報案。確實沒有警力幫你去解決這種小案子,因為還有很多大事。

我們的使用者體驗還在持續的最佳化,我們是希望把所有的資料在一個後臺全部都能連線起來,他將來不僅能夠解決公共安全的問題,他還可以解決很多的問題。當然了,他存在資料安全隱私的問題,這些也是我們需要解決的課題。公安系統裡面內部是有很多的隱私保護的方法的,比如不同級別的領導分別能看什麼樣的資料,所以相對隱私保護的還是挺好的。而且不同的業務警種,比如說反恐,禁毒,他們看到的資料範圍還不一樣。我們的隱私其實是有保護的,這些資料確實是可以幫助我們解決很多很多問題。

我們這個產品SCOPA今天已經在30多個城市上線,幫助我們的客戶在應用,解決了很多安全的問題,而且我們相信將來不僅僅解決安全問題,而是解決整個政府的公共服務問題。這就是明略做的工作,我們也很驕傲可以把這個產品孵化出來。

所以我最後稍微用兩頁總結一下,第一個就是我自己做了很多企業級的服務,我自己投資了很多企業級服務,這裡面有幾個關鍵的問題,第一個就是為什麼選擇大B服務,我剛剛給大家講了,大B服務其實才有錢,那個場景有價值,小B服務根本沒錢付你。

還有更重要的一個原因,大B企業裡面有專業的使用資料的人,大B企業都有BI團隊,他們都會用這些工具。小的公司他哪有BI人員?你給他資料工具他哪會用啊,你除非這個工具使用者體驗無比的好,完全自動,這個可能性也不大,至少到今天可能性不大。當然,我想說,要用發展的眼光看問題,未來會越來越好的,小B也會越來越賺錢,每一個企業他未來的人員的素質也會越來越高。但今天在中國做小B生意確實還是賺不著錢。

營銷為什麼在中國能贏,我剛剛已經給大家講過了。

然後做政府原因為什麼選公安,我剛剛給大家講過了。

還有一件事情,企業級服務,因為我們做投資的同學不要想著企業去服務像2C的一樣,一年成長10倍,不太可能,因為企業級服務其實是一個長跑,像秒針今天是做了十一年多我們才成為我們市場裡面絕對老大,壟斷了,這是需要花很長的時間去迭代的。為什麼呢?因為企業級服務跟消費者不一樣,他換供應商的速度太慢了,大家都知道企業對產品的忠誠度遠遠高於個人。

大家昨天還用蘋果呢,今天突然覺得小米不錯,就換了。這個決策很簡單,你自己就做決策了,但是企業不是這樣,企業是團隊決策,一個人,就算是CEO拍板了,也未必能成。我經常跟團隊說,大家一塊來用,然後同事們一堆反對,最後真的就放棄了,我不知道大家做老大是不是都這樣,你換東西也沒那麼簡單的。

所以企業級服務他的迭代是很慢的,每年一次招標。今年要做什麼事,一招標,你這次輸掉了,一年之後再來重新招標吧。所以你每一次產品更新迭代他都是以年為單位的在迭代,他是一個慢慢發展的過程。

而且企業級市場很有意思的,他有一個學習鏈。有一本書叫《跨越鴻溝》,講了一個市場拓展的曲線,整個市場如果是100%,頭2.5%叫創新者,這些人是有什麼新的東西他都敢試的,他不怕試錯。後面13.5%叫做早期採用者,這些人是看了那些創新者一旦用了他覺得不錯,挺好的,他也過來買一件。再後面34%,這一類人叫早期大眾,就是一個產品一旦遇到這個點的時候,一旦第三段的人都開始買了,這個產品就算爆品了。

這個曲線2C和2B都是一樣的,那這個過程其實是後面的人看到前面的人用了沒問題才用的,後面還有幾段,那我說的就是第二段到第三段跨過去,你這個產品就算真成了。

那企業級服務業務的發展規律呢?舉個例子,像廣告這個行業,創新者是誰?寶潔,全世界最大的廣告主,聯合利華,全世界第二大廣告主,他們會先用,用出來看結果在兩年之後了,他第一年先建設,第二年摸索,第三年他才用成。用成了,大家想想,第二段的人才會過來學他,小一點的廣告客戶才會去學他。然後接著又經過三年,第三段的才去學,就是這個過程,它是個很慢的過程。大家不要想著企業級服務一下就能起來,不太可能。所以做企業級服務一定是要有耐心的。也有好的一面,因為他loyalty很高,所以你一旦拿了客戶的話你也不容易丟,我們續業率是非常高的,95%以上,業務很安全,很穩定。

同樣,中國有的時候學美國,美國總部先試,兩年之後中國開始學美國,也是這個過程。所以我們有的時候也要去美國總部去賣,賣完了以後美國總部說這個產品很好,在中國試吧。

Go global的原因也是這樣,做企業你不go global,最後肯定會被global顛覆,除了個別的行業,比如說像安防。因為全世界最優秀的企業,今天為止還都是在美國,當然了,未來,用發展的眼光看問題,未來我相信會越來越多像我們這些同學們,大家都成為跨國公司的CEO。我們這些企業都將走向世界,這個時候中國的企業級服務也都會成長起來。

然後重視市場教育,重視這個ROI的決策線。這個其實都是我們在企業級服務裡面要去不斷的思考的。這個決策,他的產出是什麼,他的機會成本是什麼,他的ROI是什麼,其實要不停的去思考,不停的去思考。我們在不同的階段你要去講不同的故事來教育這個市場,所以企業級服務有很多learning。

小結:

1. 為什麼選擇大B服務?

  • 人:大B的客戶資料思維更強,更懂得如何使用資料產品。

  • 場景:大B服務對應的場景市場規模更大,更有“錢”景。(用發展的眼光看世界,未來小B也會有大市場)

2. 為什麼營銷業務在中國能贏?

營銷場景的核心決策是如何更瞭解客戶,中國企業更瞭解中國市場

3. 做政府業務為什麼選擇公安作為突破口?

  • 場景:場景體量大,公安裡絕大多數都是資料系統

  • 人:出於安全考慮,中國政府更傾向於購買國內企業的資料產品服務

4. 企業級服務是長跑,迭代週期為一年

  • 相對ToC產品的採購,企業每年一次招標,採購決策鏈長,採購影響因素更複雜;

  • 企業級服務產品的普及所花時間更長,只有經歷了巨頭試水–巨頭廣泛使用–中小型企業使用之後,才算“普及”

  • 企業級服務優勢:續業率高。由於企業更換供應商成本高,相比個人,企業對產品忠誠度要高得多

5. 為什麼儘快Go Global?

  • 不進則退。不go global,最後就會被global顛覆。

  • 發展的眼光看問題:中國的企業級服務正在迅速發展,走向世界

04 總結

資料產品的這些前面我都介紹了,資料的本質其實是用數學去記錄這個世界,理解這個世界。

資料做生意是個悖論,我們要知道什麼情況下的資訊不對稱,能賺錢。

資料本身沒有價值,你要利用這個資料源,理解以後你在那個場景裡面應用,那個場景的價值才是你資料的價值,單純的資料沒有任何價值。

資料產品的價值等於決策著提前瞭解變化所節省的成本和新增的價值再減去你的替代成本。

然後資料商業化三要素,資料源、人、場景,他們的巨大的變化才有資料產品的誕生機會,資料品牌的誕生機會。

而且我們要不斷的建設活資料的反饋閉環,不斷的加速這個迭代,最終的標的其實是利用資料形成人工智慧,形成AI。

這是資料產品的我的一個總結,前面我都已經介紹了。

所以我自己的價值觀就是,我學數學的,就是要用數學來解釋這個世界。數學是特別重要的一個工具,我們理解這個世界,是從定性到定量,從模糊到精準一個過程。但是我還是告訴大家,這個世界沒有真理,數學只是一個思維工具,因為底層的公理,有一天突然出現一個新的事,那個公理資訊就變了。這個世界上是沒有真理的,資料最核心最核心的價值是產生信任。讓我們每個人更加勇敢的去工作,更加勇敢的、更加幸福的、更加快樂的去工作,這個是資料最核心的一個價值。大家不要去猶豫,不要去糾結,非常非常的重要。

所以我的分享就到這兒,希望對大家有用。

謝謝。

來源:明略資料

精彩活動

福利 · 閱讀 | 免費申請讀大資料新書 第23期

推薦閱讀

2017年資料視覺化的七大趨勢! 

全球100款大資料工具彙總(前50款) 

論大資料的十大侷限

大資料時代的10個重大變革

大資料七大趨勢 第一個趨勢是物聯網

Q: 看完這篇長文,你有什麼看法?

歡迎留言與大家分享

請把這篇文章分享給你的朋友

轉載 / 投稿請聯絡:hzzy@hzbook.com

更多精彩文章,請在公眾號後臺點選“歷史文章”檢視

贊(0)

分享創造快樂