一、大數(shù)據(jù)時(shí)代已來臨:
目前以云存儲(chǔ)為代表的公共存儲(chǔ)服務(wù)模式已初現(xiàn)端倪,將可能在未來5-10年成為主流 存儲(chǔ)模式之一。類似于水電氣公共服務(wù),存儲(chǔ)平臺(tái)服務(wù)化意味著現(xiàn)有的存儲(chǔ)系統(tǒng)面臨新的挑戰(zhàn)。存儲(chǔ)按需服務(wù)的公共模式將引入用戶應(yīng)用的多樣性、異構(gòu)性和個(gè)性化、用戶訪問的高并發(fā)性和動(dòng)態(tài)性、以及數(shù)據(jù)自身的復(fù)雜性等特點(diǎn),導(dǎo)致大數(shù)據(jù)時(shí)代的趨勢(shì)和特征凸現(xiàn)。大數(shù)據(jù)電子商務(wù)在現(xiàn)實(shí)世界中有著非常廣泛的分布和應(yīng)用,包括醫(yī)療信息、視頻監(jiān)控、移動(dòng)設(shè)備、智能設(shè)備、非傳統(tǒng) IT
設(shè)備、傳統(tǒng)IT 非傳統(tǒng)應(yīng)用以及特定行業(yè)需求等。如在零售業(yè)中,對(duì)大數(shù)據(jù)電子商務(wù)的分析越來越受重視。沃爾瑪在全球有8400家門店,每周有20億筆客戶交易數(shù)據(jù),沃爾瑪公司很早就開始從日常交易記錄析出關(guān)聯(lián)交易,在2004年卡特里娜颶風(fēng)來襲前,沃爾瑪就從手電筒和電池的銷售中成功分析出餡餅即將熱銷。隨著計(jì)算機(jī)和存儲(chǔ)成本的下降,中小型零售企業(yè)也能夠利用IT技術(shù)對(duì)收集的大量數(shù)據(jù)分析,開展商務(wù)智能應(yīng)用。再如,在醫(yī)療健康領(lǐng)域,由于電子醫(yī)療記錄時(shí)代的來臨、醫(yī)療圖像技術(shù)進(jìn)步、基因研究以及制藥工程中對(duì)于大型數(shù)據(jù)庫(kù)的應(yīng)用,大規(guī)模復(fù)雜數(shù)據(jù)在醫(yī)療機(jī)構(gòu)中變得很普遍。通過對(duì)大量病人的各類數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘分析,有助于更有效地找出疾病成因,進(jìn)而提供針對(duì)性地預(yù)防、診斷和治療措施。美國(guó)著名的綜合管理式醫(yī)療財(cái)團(tuán)Kaiser Permanente,擁有超過8百萬會(huì)員、36 家醫(yī)院以及超過400家醫(yī)療機(jī)構(gòu),各部門需要在同一時(shí)間分析眾多因素,包括治療、人口統(tǒng)計(jì)資料(如年齡、性別等)、實(shí)驗(yàn)室結(jié)果、處方、診斷、醫(yī)療保險(xiǎn)計(jì)劃以及付款記錄等,綜合這些不同的信息,以便決策系統(tǒng)向醫(yī)護(hù)人員提供完整的病人歷史,選擇最佳的醫(yī)護(hù)辦法。
二、潛在商機(jī)李開復(fù)的12月3日的更新的微博針對(duì)大數(shù)據(jù)電子商務(wù)時(shí)代進(jìn)行了預(yù)測(cè)【:大數(shù)據(jù)電子商務(wù)的可能應(yīng)用領(lǐng)域】
1. 保險(xiǎn)業(yè):收集汽車駕駛數(shù)據(jù)制定個(gè)性化保險(xiǎn)政策價(jià)等;
2. 零售商:基于全市場(chǎng)數(shù)據(jù)的商品推銷策略分析等;
3. 金融業(yè):利用歷史數(shù)據(jù)分析詐騙等;
4.醫(yī)療保障:通過健康數(shù)據(jù)提高病人護(hù)理?xiàng)l件等;
5.制造業(yè):估算保修費(fèi)用,檢測(cè)零部件問題等。
針對(duì)大數(shù)據(jù)時(shí)代的進(jìn)行深度分析挖掘,將能創(chuàng)造巨大商機(jī),目前各大電子商務(wù)網(wǎng)站如淘寶網(wǎng),
繁多的產(chǎn)品讓人無從抉擇,用戶能做的就是反復(fù)對(duì)比同類產(chǎn)品的優(yōu)缺點(diǎn),過往買家的評(píng)論來決定自己的選擇,但是這對(duì)用戶來說是極其痛苦的,如果后臺(tái)能對(duì)海量的用戶行為數(shù)據(jù)進(jìn)行快速分析,推薦出用戶階段性最需要最適合的產(chǎn)品,將能極大的促進(jìn)商家的銷售額。
目前推薦做得較好的網(wǎng)站有亞馬遜和當(dāng)當(dāng)網(wǎng)等,能針對(duì)用戶需要,動(dòng)態(tài)的給與極其準(zhǔn)
確的推薦信息,推薦結(jié)果準(zhǔn)確,推薦更新度極快。
三、大數(shù)據(jù)時(shí)代信息推薦相關(guān)技術(shù)
推薦技術(shù):主流的推薦算法有基于物品相似度的推薦和基于用戶相似度的推薦。目前各大電商網(wǎng)站普遍采用的是基于物品的相似度推薦,但是如何將準(zhǔn)確度量用戶的興趣仍然是個(gè)難題;基于用戶相似度推薦主要用在新聞等用戶遠(yuǎn)少于物品的網(wǎng)站,如新聞評(píng)論類網(wǎng)站。 并行計(jì)算技術(shù):為了提高用戶服務(wù)質(zhì)量,后臺(tái)采用Hadoop的mapreduce技術(shù)進(jìn)行分布式并行計(jì)算是主流趨勢(shì),但是該技術(shù)存在嚴(yán)重的單點(diǎn)故障和性能瓶頸,目前國(guó)內(nèi)外各大研究所都在針對(duì)hadoop存儲(chǔ)平臺(tái)和mapreduce技術(shù)進(jìn)行優(yōu)化研究,最新銳的研究技術(shù)產(chǎn)品是MapR“構(gòu)建一個(gè) HDFS 的私有替代品,這個(gè)替代品比當(dāng)前的開源版本快三倍,自帶快照功能,而且支持無Namenode單點(diǎn)故障(SPOF),并且在API上和兼容,所以可以考慮將其作替代方案?!保?
四、大數(shù)據(jù)時(shí)代信息推薦相關(guān)網(wǎng)站介紹
9 點(diǎn)優(yōu)品:該網(wǎng)站用戶定位做最有品質(zhì)的購(gòu)物推薦,經(jīng)本人分析網(wǎng)站主要針對(duì)100 以上品牌商品進(jìn)行推薦,有較多針對(duì)攝影愛好控的權(quán)威推薦,優(yōu)質(zhì)正品推薦是
該網(wǎng)站的最大優(yōu)點(diǎn),網(wǎng)站對(duì)產(chǎn)品的價(jià)格、銷量、質(zhì)量三方關(guān)注,同時(shí)附帶個(gè)人評(píng)價(jià),有一定的參考價(jià)值,另外有個(gè)“我勒個(gè)趣”的趣味推薦,主要發(fā)布新奇特推薦信息,比較吸引眼球。網(wǎng)站缺點(diǎn)在于關(guān)聯(lián)推薦做得不夠好,如推薦榨汁機(jī)的關(guān)聯(lián)推薦中三款喲兩款是體恤刀,目測(cè)推薦技術(shù)采用的只是分類關(guān)聯(lián)推薦,粒度太大,有待改進(jìn);另外網(wǎng)站缺乏網(wǎng)友交互功能。逛:該網(wǎng)站定位女性逛街推薦品,主打推薦的產(chǎn)品很便宜,如小
飾品小零食,網(wǎng)站采用圖片瀑布流的推薦模式,很適合女生瀏覽,但缺點(diǎn)是推薦的描述信
息量小,難以判斷推薦產(chǎn)品的優(yōu)劣。什么值得買:該網(wǎng)站最大特點(diǎn)是交互做得很好,有網(wǎng)友對(duì)推薦信息的二度評(píng)價(jià),幫助用戶做出判斷,但缺也很明顯,產(chǎn)品推薦缺乏層次,高中低端都有,且混雜在一起,難以去按價(jià)格分類選擇。 惠惠:該網(wǎng)站是網(wǎng)易旗下購(gòu)物推薦網(wǎng)站,主打推薦是購(gòu)物返現(xiàn)活動(dòng),頁(yè)面交互體驗(yàn)很好,但是對(duì)于返現(xiàn)操作對(duì)很多用戶還是太陌生,如果想要發(fā)展,建議先做普及。否則用戶群體只能是網(wǎng)購(gòu)資深達(dá)人,不適合普通用戶。
五、大數(shù)據(jù)時(shí)代信息推薦的未來
以上大數(shù)據(jù)時(shí)代推薦信息目前都是人工運(yùn)營(yíng),運(yùn)營(yíng)強(qiáng)度極大,且具有個(gè)人偏好,對(duì)運(yùn)營(yíng)人員來說極辛苦,對(duì)用戶來說,隨機(jī)性較大;如果能將傳統(tǒng)的推薦算法與人工推薦有機(jī)結(jié)合,在后來采取 MapR計(jì)算框架,結(jié)合前臺(tái)推薦算法和人工推薦結(jié)果,將極大的推動(dòng)這一產(chǎn)業(yè)的未來發(fā)展。