大數(shù)據(jù)已經(jīng)是趨勢,這一點(diǎn)毋庸置疑。然而,火爆的概念之下卻難以看到大數(shù)據(jù)產(chǎn)品的真容,大數(shù)據(jù)因此被業(yè)內(nèi)人士扣上“炒作”的莫須有罪名。難落地,已經(jīng)成為大數(shù)據(jù)發(fā)展過程中的一個(gè)痛點(diǎn),也是大數(shù)據(jù)最難的突破點(diǎn)。
盡管很難,各互聯(lián)網(wǎng)巨頭和一些傳統(tǒng)企業(yè)都在深耕大數(shù)據(jù),阿里巴巴收購新浪微博18%股份,是巨頭們布局大數(shù)據(jù)的戰(zhàn)略。其實(shí),除阿里巴巴外,很多企業(yè)都在布局大數(shù)據(jù),因?yàn)閷?duì)于企業(yè)而言,大數(shù)據(jù)就像一座巨大的金礦。
談及大數(shù)據(jù)的意義,IBM華生實(shí)驗(yàn)室博士張書平提到,透過大數(shù)據(jù)的分析技術(shù),人類在社群媒體上的互動(dòng)與喜好,生活周遭的各種數(shù)據(jù),都可以被歸納整理成有意義的信息,只要能夠掌握大數(shù)據(jù)并且實(shí)時(shí)分析,就能有效的改變交通、運(yùn)輸、能源、醫(yī)療等產(chǎn)業(yè),進(jìn)而創(chuàng)造龐大商機(jī)。
面臨巨大的商機(jī),巨頭們加速前行。就現(xiàn)狀而言,很多企業(yè)對(duì)大數(shù)據(jù)商機(jī)的挖掘,仍停留在數(shù)據(jù)整合上面。的確,收購了新浪微博部分股份后,淘寶的很多廣 告出現(xiàn)在新浪微博頁面,但很多微博用戶反饋稱,淘寶的廣告投放并不精準(zhǔn)。也就是說,阿里巴巴與新浪微博的這一案例,稱不上成功的大數(shù)據(jù)營銷案例。
在社交領(lǐng)域,騰訊朋友網(wǎng)可以說是一個(gè)比較成功的案例。借助數(shù)據(jù)QQ用戶數(shù)據(jù),以及QQ空間、騰訊微博等多個(gè)產(chǎn)品的數(shù)據(jù),深度挖掘和分析后,能夠?qū)⒂脩舻暮糜殃P(guān)系進(jìn)行匹配,讓用戶從校友、家人等多個(gè)維度尋找好友。
在視頻領(lǐng)域,收購了PPS的愛奇藝也在布局大數(shù)據(jù)。日前,愛奇藝PC客戶端全面改版,依靠大數(shù)據(jù)分析實(shí)現(xiàn)了“千人千面”的首頁全個(gè)性化的內(nèi)容推薦。 筆者測試了一下,推薦內(nèi)容全部是基于個(gè)人觀看記錄,以及搜索記錄計(jì)算出來的結(jié)果,而且結(jié)果很精確。由于暑假期間兒子經(jīng)??磩?dòng)畫片,我的愛奇藝客戶端首頁推 薦內(nèi)容中,全是兒子感興趣的內(nèi)容。
愛奇藝、朋友網(wǎng)和阿里浪等案例都是大數(shù)據(jù)時(shí)代的產(chǎn)物,這意味著大數(shù)據(jù)并非炒作。事實(shí)上,大數(shù)據(jù)之所以難落地,根源還是數(shù)據(jù)。無論是基于大數(shù)據(jù)的營銷,還是基于大數(shù)據(jù)的產(chǎn)品,必須有龐大的數(shù)據(jù)作為支撐,以實(shí)現(xiàn)廣告精準(zhǔn)投放或內(nèi)容的精準(zhǔn)推送。
以愛奇藝PC客戶端個(gè)性化首頁這一產(chǎn)品來說,其數(shù)據(jù)來源不僅僅是愛奇藝觀看記錄,還有愛奇藝站內(nèi)搜索數(shù)據(jù),以及百度視頻搜索數(shù)據(jù),愛奇藝用戶觀看行 為等數(shù)據(jù)。除個(gè)性化首頁外,今年5月愛奇藝還推出的大數(shù)據(jù)精準(zhǔn)廣告投放系統(tǒng)“一搜百映”,通過挖掘搜索引擎海量數(shù)據(jù)價(jià)值來優(yōu)化視頻廣告服務(wù),同時(shí)減少對(duì)非 目標(biāo)用戶的廣告打擾。如果用戶通過百度搜索“購置稅”關(guān)鍵字,在愛奇藝客戶端觀看視頻時(shí),貼片廣告是汽車相關(guān)的廣告。此外,還會(huì)根據(jù)用戶的年齡、性別和收 入等信息,確定推送哪一品牌的汽車廣告。
相比之下,阿里巴巴注資新浪微博謀求大數(shù)據(jù)廣告精準(zhǔn)推送戰(zhàn)略的受挫,原因恰恰是數(shù)據(jù)挖掘和分析能力欠缺。眾所周知,新浪微博有數(shù)億用戶,阿里巴巴有 市場份額最大的電商平臺(tái)淘寶。在沒有對(duì)兩家用戶數(shù)據(jù)進(jìn)行打通并深度挖掘和分析后,在新浪微博實(shí)現(xiàn)精準(zhǔn)廣告投放是很難的,這才有了很多新浪微博用戶抱怨淘寶 推送的廣告不精準(zhǔn)的一幕。再看騰訊旗下的朋友網(wǎng),人脈匹配之所以如此精準(zhǔn),就是因?yàn)轵v訊對(duì)QQ、QQ空間和騰訊微博幾大產(chǎn)品用戶行為數(shù)據(jù)進(jìn)行了精準(zhǔn)挖掘和 分析。
顯而易見,大數(shù)據(jù)需要龐大的數(shù)據(jù)積累,以及深度的數(shù)據(jù)挖掘和分析。無論是精準(zhǔn)廣告投放,還是個(gè)性化定制,大數(shù)據(jù)要想落地,必須有兩個(gè)條件:一是豐富的數(shù)據(jù)源,二是強(qiáng)大的數(shù)據(jù)挖掘分析能力。很多企業(yè)在大數(shù)據(jù)戰(zhàn)略上受挫,就是因?yàn)閿?shù)據(jù)源匱乏。
未來,企業(yè)要想在大數(shù)據(jù)時(shí)代領(lǐng)先,必須多方合作獲取更多的數(shù)據(jù),這是大數(shù)據(jù)的基礎(chǔ),也是大數(shù)據(jù)戰(zhàn)略成敗的核心。而相應(yīng)的數(shù)據(jù)分析能力,則需要企業(yè)繼續(xù)苦練內(nèi)功。
在企業(yè)信息化建設(shè)及互聯(lián)網(wǎng)行業(yè)的發(fā)展過程中,數(shù)據(jù)量的增長已經(jīng)達(dá)到了前所未有的速度。廠商、分析師以及技術(shù)專家認(rèn)為“大數(shù)據(jù)”(Big Data)時(shí)代已經(jīng)到來,針對(duì)大數(shù)據(jù)的相關(guān)技術(shù)已經(jīng)被IT部門提上了議事日程。除了如何存儲(chǔ)管理大數(shù)據(jù),更為重要的問題是如何利用大數(shù)據(jù)為企業(yè)服務(wù),通過商業(yè)智能以及高級(jí)分析應(yīng)用將其價(jià)值發(fā)揮到最大。
大數(shù)據(jù)的概念同我們比較熟悉海量數(shù)據(jù)有所區(qū)別,它可以用三個(gè)V來總結(jié),即Variety、Volume和Velocity(多樣性、數(shù)量、速度)。不難 理解,無論目前結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù),它們?cè)谏疃扰c廣度上都飛速地增長著,企業(yè)能否有效管理并挖掘利用這些數(shù)據(jù)將決定信息化建設(shè)的發(fā)展走勢。除此之 外,技術(shù)提供商也紛紛將目光瞄準(zhǔn)大數(shù)據(jù)領(lǐng)域,IBM、SAP、Teradata等數(shù)據(jù)倉庫及商業(yè)智能廠商都在積極地推廣各自的理念和產(chǎn)品。為 此,TechTarget記者在2011年大數(shù)據(jù)世界論壇上對(duì)Teradata公司的首席客戶官周俊凌進(jìn)行了采訪,讓他來談一談大數(shù)據(jù)與BI分析、數(shù)據(jù)倉庫技術(shù)的發(fā)展。 平臺(tái)技術(shù)選擇應(yīng)由需求驅(qū)動(dòng) 新概念是新技術(shù)的催化劑,在大數(shù)據(jù)領(lǐng)域中,一些新技術(shù)包括Hadoop、MapReduce都得到了更廣泛的應(yīng)用,Hadoop MapReduce為通用計(jì)算與分布式架構(gòu)架起了一座橋梁,而傳統(tǒng)的企業(yè)數(shù)據(jù)倉庫技 術(shù)(Enterprise Data Warehouse,EDW)則遭遇了前所未有的挑戰(zhàn)。通過使用Apache Hadoop,企業(yè)能夠避于支付大量的軟件許可費(fèi)用,還可以根據(jù)變更的需求更改原代碼從而得到更高的靈活性。如何在Hadoop和EDW之間做出選擇困擾 著許多企業(yè)用戶,對(duì)此周俊凌表示,技術(shù)以及平臺(tái)的選擇在大數(shù)據(jù)時(shí)代同之前相比并沒有太多的不同,企業(yè)首先考慮的仍然是自身業(yè)務(wù)需求。Hadoop架構(gòu)的存 在有它的理由,但是這并不意味著在成本方面會(huì)比EDW有更多優(yōu)勢。 “企業(yè)在進(jìn)行技術(shù)的選擇時(shí)不應(yīng)只看首次投入的成本,Hadoop不是 一勞永逸的,你需要不斷對(duì)其進(jìn)行維護(hù),考慮持續(xù)的投入,無論是人力還是物力,它都可能會(huì)比傳統(tǒng)的EDW要大。因此企業(yè)不應(yīng)該一味迷信于新技術(shù),無論是購買 平臺(tái)還是進(jìn)行定制,用戶需要從自身需求出發(fā)。” 周俊凌解釋說。 在談到國內(nèi)企業(yè)技術(shù)的選擇時(shí),周俊凌還表示,一些客戶更具開放性和前瞻 性,特別愿意嘗試大數(shù)據(jù)帶來的新技術(shù),打造自己的競爭優(yōu)勢,一些較小的客戶和新行業(yè)都積極采用這樣的新技術(shù)和工具。中國市場有其獨(dú)特之處,中國的客戶會(huì)對(duì) 這樣產(chǎn)品和技術(shù)做出更快的響應(yīng),而且中國在計(jì)算方面的基礎(chǔ)設(shè)施都比較新,中國是更加開放的,能夠更加積極接受這種新技術(shù)。 Teradata通過收購補(bǔ)充產(chǎn)品功能 數(shù)據(jù)倉庫市場是一個(gè)相對(duì)成熟的市場,其中Teradata一直保持在領(lǐng)導(dǎo)者的地位,但近兩年伴隨著大數(shù)據(jù)技術(shù)的發(fā)展,業(yè)內(nèi)也出現(xiàn)了許多大型的并購,其中包括Oracle收購Sun、IBM收購Netezza、EMC收購Greenplum等。 像Oracle這樣的廠商已經(jīng)具備了推出集成平臺(tái)(Appliance)產(chǎn)品的能力,在Gartner今年發(fā)布的數(shù)據(jù)倉庫平臺(tái)報(bào)告中,許多合并后的廠商都 保持了強(qiáng)勁的勢頭,這給Teradata的地位造成了比較大的挑戰(zhàn)。對(duì)此,周俊凌認(rèn)為對(duì)于Teradata來說,無論是否出現(xiàn)并購,其影響都不大。數(shù)據(jù)倉 庫是個(gè)比較成熟的市場,競爭的格局已經(jīng)存在多年,并在一段時(shí)間內(nèi)不會(huì)出現(xiàn)太大的變動(dòng)。 |