大數據從不是免費午餐!企業與新創如何從「用數據」到「養數據」?

大數據從來不是免費的午餐。伴隨大數據熱潮的到來,關於大數據的新問題層出不窮-大數據會夾雜虛假資訊;大數據的數據量很大,但有用的資訊不一定多,甚至還會破壞核心資訊;大數據的來源是多管道的,偏倚、隨機的誤差總是存在。

但是,我們也需要客觀認識到,大數據現在面臨的這些問題,其實就是把小數據中的一些問題放大了。小數據中難道就沒有噪音會破壞我們的核心資訊嗎?當然也有,只不過當大數據把數據量放大和變多的時候,噪音的破壞性也相應增大。小數據中難道就沒有管道偏倚和隨機的問題嗎?當然也有,但是在大數據的背景下,問題被更明顯地放大了。

透過對數據的收集、分析、探索與運用,在數據的維度中找到全新的藍海,有效掌握產業趨勢,並打造優勢的立基。

斷層才是最大問題

說了這麼多,事實上,還沒有觸碰到如今大數據面臨的最大問題-人。

很多人都會問:大數據能帶來什麼價值?如何衡量大數據創造的價值?事實上,最直接的衡量標準就是,在經營上,它為你賺了多少錢,帶來了多少實際的利潤提升。

對於這個問題,現在很多人最傾向使用的解決方法是計算在用了大數據之後,點擊率提高多少、轉換率提高了多少。但是要知道,轉換率和點擊率提高的數據,可能根本不是投資人或公司最高管理者對大數據的期望。對業務人員來說,轉換率能提升五個百分點就已經非常好了,如果能將轉換率從2% 提高到3%,簡直就是奇蹟。但是對公司最高管理者來說,這並不是他想要的大數據。

斷層才是大數據所面臨最嚴重的問題。收集數據的人並不清楚未來使用數據的人要做什麼,這是目前大數據運用的一大關鍵問題。 在使用大數據時,通常是先收集數據,因為我們知道在未來的某一刻,這些數據對我們可能有用。不過,「未來可能有用」就注定會引發一個問題—收集數據的人不知道未來使用數據的人要做什麼。這時候,如果你再問收集數據的人:「如何才能更好地收集數據?」數據的使用就會陷入死循環。

事實上,不僅是收集數據的人,就連設計數據模型的人也同樣不清楚數據是如何獲得的。設計數據模型是使用數據的關鍵環節,也就是從以往經驗中找到一些潛在的規則,然後把這些規則結合起來以解決問題。

舉個例子來說,我現在身上只有10元人民幣,我可以用它買一本雜誌,也可以用它搭幾次公車,或者買泡麵充饑。這三種選擇在一般情況下都是可行,但是,如果再加上「我沒有吃早餐」的情境,在以上三種可能性中,我選擇吃泡麵的機率自然比較大。這其實就是一個簡單的模型-輸入「擁有10 元人民幣」和「沒有吃早餐,肚子餓」這兩個情境,輸出「買泡麵」這個結論,幫助我們快速選擇一條解決之路。

選擇「吃泡麵」的情境,雖然看似簡單,但同樣是經驗的總結,這個經驗就是「肚子餓了要吃飯」。把設計數據模型的過程說得更複雜或更專業一點,就是基於很多以往的經驗,進行總結,或是發現舊有數據使用規則,將經驗和數據相結合,最後輸出一個可以被套用的業務規則。

不過,此時負責設計數據模型的人不一定完全清楚數據是如何產生的,這是客觀存在的難題。就大數據研究而言,很多時候,我們使用的是他人的數據,既然是他人的數據,又怎麼能夠保證自己完全清楚呢?

關於大數據的運用,最近流行一個例子:假設我在搜尋引擎中發現某個地方搜尋「感冒藥」的頻率非常高,於是,我就斷定這個地方可能出現了流行性感冒。但這個數據是從何而來?我雖然知道很多人搜尋了「感冒藥」,卻完全不知道搜尋這個詞語的人到底是誰。提供數據的人既沒有責任告訴我數據是怎麼來的,也不必告訴我數據的品質如何,更不必告訴我數據會不會有偏差。這種情況推及到大數據領域就是,研究數據的人完全不清楚數據是怎麼來的。

數據化思維:問題就是答案

大數據改變了人類學習、工作和生活的方式,更改變了人類的思維方式,而我所談的數據化思維,正是從大數據的特色中產生的。西方式的思考著重系統性分析,因此對一件事情的理解過程,大多是利用數據進行細分/歸類、對比、溯源,以及從三者的動態趨勢中,找出變化的規律。我們可以從以下這幾點著手:

目的(Purpose):假設我們的目的是如何讓自己更「好運」。

定義(Identify):我們要定義什麼是「好運」,例如,可以細分為財運、健康或人緣。

量化(Measure):要如何量化「好運」?參照前面的定義,尋找可量化的目標,例如,工資增長率、體檢中某項指標的高低等。量化之後,我們可以從趨勢中預判做什麼可以更「好運」。

評估(Assess):執行之後,評估什麼做對了、什麼做錯了。

可見,西方式思考中的溯源,就是從事物中找出因果關係,尋找能夠有效獲得成功的驅動力。而東方式思考中的溯源,則是從本質找出根源,例如,「好運」的本質,可能在經過分析後,顯示為「快樂」,但量化出來的結果卻是「笑」。

然而,不管東方或西方,要溯源,一切答案都得從問題開始。

良好的提問技巧,能使我們在尋找答案的道路上事半功倍。好問題(deep question),可以使我們離答案更近一步。 曾經有位知名CEO很得意地問了我的老師一個問題:「你覺得到底是eBay 的商業模式好,還是Amazon 的商業模式好?」他的言外之意是,今天Amazon 做得比eBay 好,是不是也就意味著它的商業模式比較好。

我的老師並沒有直接回答這位CEO 的問題,而是反問了一個問題:「你的問題也許跟商業模式無關,產生這樣的結果,會不會只是因為Amazon 的CEO 做得比eBay 的CEO 好?」無須多言,問題就是答案。所以,對一件事情的認知,要看你是否具備了「用問題解決問題」的能力。

2011 年,阿里巴巴開始從數據化營運轉向營運數據,當時,我負責支付寶的營運數據工作,我十分苦惱,毫無頭緒,於是,我打電話向老師求助,諮詢他對於這個問題我應該如何思考。接下來發生的事情讓我非常難忘,老師並沒有直接回答我,而是問了我三個問題:

你所在的公司目前面對的三大問題是什麼?

未來三個月中,公司要解決的問題是什麼?

在過去的一個月裡,你做對了什麼,做錯了什麼?

「我現在給你五分鐘時間,如果你說不出公司目前面臨的三大問題,而你作為商業智慧部門的負責人,基本上,就不該繼續坐在這個位置上了。」他這麼說。

當然,我明白這三個問題裡已經包含了答案。當你要做數據化營運或營運數據時,你必須問自己這些問題。如果你沒有問自己這些問題,就去想如何收集數據的話,那肯定會出問題,這是很關鍵的一點。

大數據使企業經營者擁有了望遠鏡和顯微鏡,除了能對已知事物觀察得更清楚之外,更關鍵的是,使我們能看到之前從來沒有想到、沒有觀察到的事物。

所以,思維方法很重要,在有了數據、有了對商業理解的前提下,思維方法是不可或缺的關鍵。思考的方法是無窮盡的,就像兩個武林高手過招,假設一方面對的是功夫高手李小龍,作為局外人的我,自然無法給出得勝的建議,這需要他自己動態地尋找答案。

文章來源:https://meet.bnext.com.tw/articles/view/46189