要實現(xiàn)大數(shù)據(jù)核心價值的前兩個重要的步驟,第一步是通過“眾包”的形式收集海量大數(shù)據(jù),第二步是通過大數(shù)據(jù)分析的技術(shù)途徑進行“全量大數(shù)據(jù)挖掘”,最后利用分析結(jié)果進行“資源優(yōu)化配置”。
只說概念大家肯定沒法直觀的理解上面的觀點,那就將幾個咱們都接觸過的例子講一講大數(shù)據(jù)是怎么通過這三步發(fā)揮核心價值的?
第一步、通過“眾包”產(chǎn)生和收集大數(shù)據(jù)
高德地圖、百度地圖都有實時路況的功能,但大家有沒有想過實時路況的大數(shù)據(jù)是怎么收集的?實際上經(jīng)過了三個階段,開始是跟交通口的一些公司合作,獲取交通流量監(jiān)測設(shè)備的大數(shù)據(jù),這個方法缺陷很明顯,一個是受制于人,一個是想擴大監(jiān)測范圍就要部署大量設(shè)備,費時費力,而且還受法律制約。于是一些專門做路況的公司開始用出租車當(dāng)浮動車收集大數(shù)據(jù)。但這種辦法還是無法覆蓋大量的大小路段,隨著移動互聯(lián)網(wǎng)的普及,高德地圖的APP能夠?qū)崟r上傳大量機動車的速度和位置信息,經(jīng)過去噪和綜合分析,就形成了覆蓋率極高的實時路況信息。這就是一個典型的“眾包”過程。
嚴謹一點來說,眾包指的是一個公司或機構(gòu)把過去由員工執(zhí)行的工作任務(wù),以自由自愿的形式外包給非特定的(而且通常是大型的)大眾網(wǎng)絡(luò)的做法。
大數(shù)據(jù)的“海量大數(shù)據(jù)”就是由“眾包”產(chǎn)生的。廣義上,用戶的行為大數(shù)據(jù),各種傳感器的大數(shù)據(jù),也都是“眾包”的形式,只要是由過去集中式的產(chǎn)生模式擴散到分布式的模式,都是眾包的形式。
第二步、通過“全量大數(shù)據(jù)挖掘”獲知“真相”
講第二個特點之前希望大家能看一下上面的視頻,通過分析阿里巴巴全年的大數(shù)據(jù)得到的阿里巴巴的世界貿(mào)易與全國貿(mào)易的趨勢。視頻中體現(xiàn)的不僅是阿里巴巴集團的運營情況,其實也部分反映了整個中國的經(jīng)濟運行情況。而且這些大數(shù)據(jù)不是通過采樣得來的,就是真真切切的“全量大數(shù)據(jù)”。我們再也不用通過“管中窺豹”的形式來推測全局,而是直接通過“上帝視角”來窺視真相。這就是大數(shù)據(jù)的魅力,我們獲得了前所未有的獲取真相的能力,而且對于大型互聯(lián)網(wǎng)公司來說,即使是PB級別的大數(shù)據(jù)分析也是準實時的,我們下一個小時就能夠得知上一個小時的全量大數(shù)據(jù)分析結(jié)果,這樣的能力是前所未有的。
第三步大數(shù)據(jù)的核心價值——“資源優(yōu)化配置”
前段時間,滴滴打車曾通過投票和訂單分析的方式得出了北上廣深四地的加班大樓排行榜,敝司不幸排名第三,但事實真的是即使加班很晚也很難打到車啊??!所以滴滴打車更名為“滴滴出行”之后,也拋出了他們偉大的愿景,那就是利用大數(shù)據(jù)分析實時綜合調(diào)度“快車”、“專車”、“出租車”、“順風(fēng)車”甚至是滴滴巴士的資源,實現(xiàn)全局的交通資源優(yōu)化。事實也是如此,滴滴的司機們越來越多的需要完成“指派任務(wù)”,而不是集中去搶高凈值客戶。也許對于個別單體來說他們的利益降低了,但全局的資源配置卻避免了全局的資源浪費和過度競爭,無疑大大提高了交通資源的使用效率。所以我們說,基于大數(shù)據(jù)分析的結(jié)果,進行資源優(yōu)化配置,才是大數(shù)據(jù)應(yīng)用的落地點和真正價值。
而“資源優(yōu)化配置”的價值,又遠遠超出我們能夠想象的層面,在資本寒冬即將來臨的大背景下,利用大數(shù)據(jù)實現(xiàn)資源的高效利用,顯得更加重要。廣告行業(yè)利用DMP、DSP進行廣告的精準投放,房地產(chǎn)行業(yè)利用大數(shù)據(jù)分析價值洼地,宜信利用大數(shù)據(jù)建設(shè)征信系統(tǒng)降低壞賬率,券商陸續(xù)推出大數(shù)據(jù)基金,全部都是廣義的“資源優(yōu)化配置”的體現(xiàn)。大數(shù)據(jù)也遠遠不再停留在學(xué)術(shù)和“分析現(xiàn)象”的階段,而是在各行各業(yè)實現(xiàn)了落地并發(fā)揮著非常非常重要的價值。
我是在互聯(lián)網(wǎng)廣告行業(yè)從事程序化購買系統(tǒng)建設(shè)的,而這個行業(yè)也是大數(shù)據(jù)最先發(fā)揮價值的地方。舉個最簡單的例子來說明大數(shù)據(jù)在廣告資源優(yōu)化配置上的作用。寶潔集團是我們的客戶,而寶潔的產(chǎn)品有非常強的用戶性別傾向性,護舒寶的廣告就應(yīng)該投給女性,投給男性就是赤裸裸的浪費。而吉列的目標(biāo)用戶就只是男性。之前保潔集團是怎么做廣告的?就是海投品牌廣告,不分性別的海投,那這個做法在投放之前就已經(jīng)確切無疑的知道有一半廣告費用時浪費的。但沒有辦法,因為我們沒有大數(shù)據(jù)技術(shù)來發(fā)掘用戶的性別。而隨著DMP(Data Management Platform)技術(shù)的不斷成熟,越來越多的廣告主建立起自己的用戶大數(shù)據(jù)中心,可以不斷積累客戶的各種用戶行為,進而判斷出用戶的性別,再通過DSP(Demand Side Platform)系統(tǒng)定向投放,最終可以為寶潔節(jié)省一半的廣告預(yù)算。上面的例子正是廣告資源的優(yōu)化配置,事實上DMP系統(tǒng)對用戶畫像的構(gòu)建精確程度遠超人們的想象,精準投放的各類篩選條件也越來越精細?,F(xiàn)在微信支持精確到設(shè)備的精準投放,也就是未來完全可能實現(xiàn)精確到每個人終端的精準投放,這都依賴于大數(shù)據(jù)對于用戶行為的挖掘,最終實現(xiàn)整個廣告行業(yè)的效果提升。
很多同學(xué)可能會說大數(shù)據(jù)的核心是大數(shù)據(jù)挖掘,是分布式存儲,是NLP,是深度學(xué)習(xí),但這一切其實只是大數(shù)據(jù)的技術(shù)途徑,大數(shù)據(jù)的終極核心價值就在于“資源優(yōu)化配置”。