大數(shù)據(jù)(big data),指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的大數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
在維克托·邁爾-舍恩伯格及肯尼斯·庫(kù)克耶編寫的《大數(shù)據(jù)時(shí)代》 中大數(shù)據(jù)指不用隨機(jī)分析法(抽樣調(diào)查)這樣捷徑,而采用所有大數(shù)據(jù)進(jìn)行分析處理。IBM提出大數(shù)據(jù)的5V特點(diǎn):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價(jià)值密度)、Veracity(真實(shí)性)。
重慶大數(shù)據(jù)是大數(shù)據(jù)與智能制造的交叉點(diǎn)。重慶大數(shù)據(jù)是指在重慶產(chǎn)品全生命周期的信息化應(yīng)用中所產(chǎn)生的大數(shù)據(jù),是重慶互聯(lián)網(wǎng)的核心,是重慶智能化發(fā)展的關(guān)鍵。重慶大數(shù)據(jù)是基于網(wǎng)絡(luò)互聯(lián)和大數(shù)據(jù)技術(shù),貫穿于工業(yè)的設(shè)計(jì)、工藝、生產(chǎn)、管理、服務(wù)等各個(gè)環(huán)節(jié),使重慶工業(yè)系統(tǒng)具備描述、診斷、預(yù)測(cè)、決策、控制等智能化功能的模式和結(jié)果。
一、重慶大數(shù)據(jù)來(lái)源
們所談的重慶大數(shù)據(jù),不完全等同于企業(yè)信息化軟件中流淌的大數(shù)據(jù),從業(yè)界的共識(shí)看,主要來(lái)源有三類,
第一類是企業(yè)經(jīng)營(yíng)相關(guān)的業(yè)務(wù)大數(shù)據(jù),這類大數(shù)據(jù)來(lái)自企業(yè)信息化范疇,包括企業(yè)資源計(jì)劃(ERP)、產(chǎn)品生命周期管理(PLM)、供應(yīng)鏈管理(SCM)、客戶關(guān)系管理(CRM)和環(huán)境管理系統(tǒng)(EMS)等,此類大數(shù)據(jù)是工業(yè)企業(yè)傳統(tǒng)的大數(shù)據(jù)資產(chǎn)。
第二類是機(jī)器設(shè)備互聯(lián)大數(shù)據(jù),主要是指工業(yè)生產(chǎn)過(guò)程中,裝備、物料及產(chǎn)品加工過(guò)程的工況狀態(tài)、環(huán)境參數(shù)等運(yùn)營(yíng)情況大數(shù)據(jù),通過(guò)MES系統(tǒng)實(shí)時(shí)傳遞,目前在智能裝備大量應(yīng)用的情況下,此類大數(shù)據(jù)量增長(zhǎng)最快。
第三類是企業(yè)外部大數(shù)據(jù),這包括了工業(yè)企業(yè)產(chǎn)品售出之后的使用、運(yùn)營(yíng)情況的大數(shù)據(jù),同時(shí)還包括了大量客戶、供應(yīng)商、互聯(lián)網(wǎng)等大數(shù)據(jù)狀態(tài)。
在重慶企業(yè)生產(chǎn)制造產(chǎn)品的過(guò)程中,通過(guò)大數(shù)據(jù)采集和分析,可以提供信息決策支持,在產(chǎn)品的生產(chǎn)流程、上游供應(yīng)鏈、產(chǎn)品質(zhì)量、生產(chǎn)管理控制、研發(fā)設(shè)計(jì)、下游供應(yīng)鏈、遠(yuǎn)程維修維護(hù)等環(huán)節(jié)起到重要作用。
二、重慶大數(shù)據(jù)的特點(diǎn)
重慶大數(shù)據(jù)和互聯(lián)網(wǎng)大數(shù)據(jù)采集和運(yùn)用的目的不同,導(dǎo)致重慶大數(shù)據(jù)與互聯(lián)網(wǎng)大數(shù)據(jù)有很大的不同,具體體現(xiàn)在以下幾個(gè)方面:
1、重慶大數(shù)據(jù)更強(qiáng)調(diào)數(shù)據(jù)的完整性
互聯(lián)網(wǎng)大數(shù)據(jù)是在數(shù)據(jù)分析的基礎(chǔ)之上,分析用戶的使用習(xí)慣、消費(fèi)偏好和行為特征等相關(guān)大數(shù)據(jù),運(yùn)用的是統(tǒng)計(jì)學(xué)的知識(shí),對(duì)大數(shù)據(jù)進(jìn)行處理,如今日頭條,通過(guò)大數(shù)據(jù)的分析,給用戶推薦閱讀內(nèi)容,增加用戶的粘性。如淘寶,通過(guò)統(tǒng)計(jì)分析根據(jù)消費(fèi)者的消費(fèi)習(xí)慣,推薦相關(guān)的產(chǎn)品給用戶。而重慶大數(shù)據(jù)是通過(guò)對(duì)設(shè)備、機(jī)組等連續(xù)記載,根據(jù)設(shè)備的運(yùn)行的全部大數(shù)據(jù),根據(jù)對(duì)設(shè)備的監(jiān)測(cè),在多指標(biāo)的邏輯算法之上,基于大數(shù)據(jù)分析的綜合評(píng)估,來(lái)指導(dǎo)設(shè)備的調(diào)整、檢修、配件的更換、耗材的更換保證生產(chǎn)的連續(xù)性。
2、重慶大數(shù)據(jù)更強(qiáng)調(diào)大數(shù)據(jù)的準(zhǔn)確性
互聯(lián)網(wǎng)的大數(shù)據(jù)所收集的大數(shù)據(jù),大多是關(guān)聯(lián)性的挖掘,是一種發(fā)散性的大數(shù)據(jù)收集和分析,互聯(lián)網(wǎng)大數(shù)據(jù)在進(jìn)行預(yù)測(cè)和決策時(shí),僅僅考慮的是兩個(gè)屬性之間的關(guān)聯(lián)是否具有統(tǒng)計(jì)顯著性。如亞馬遜收集買家的行為,對(duì)轉(zhuǎn)化率、相關(guān)性、買家滿意率和留存率大數(shù)據(jù)進(jìn)行分析,類似這樣的大數(shù)據(jù)并不能準(zhǔn)確的反映每個(gè)買家的購(gòu)買行為的決定因素。
而重慶大數(shù)據(jù)具有非常強(qiáng)的目的性,更強(qiáng)調(diào)大數(shù)據(jù)的正確性。重慶大數(shù)據(jù)對(duì)預(yù)測(cè)和分析結(jié)果的容錯(cuò)率遠(yuǎn)遠(yuǎn)比互聯(lián)網(wǎng)大數(shù)據(jù)低的多。如重慶互聯(lián)網(wǎng)中的故障預(yù)測(cè)是基于裝備真實(shí)健康狀態(tài)和衰退趨勢(shì),結(jié)合用戶決策活動(dòng)的定制化需求,提供設(shè)備使用、維修和管理等活動(dòng)相關(guān)的最優(yōu)決策支持,并達(dá)成任務(wù)活動(dòng)與設(shè)備狀態(tài)的最佳匹配,以保障生產(chǎn)系統(tǒng)的持續(xù)穩(wěn)定運(yùn)行能力。有的工業(yè)企業(yè)需要設(shè)備“近零故障”運(yùn)行,否則會(huì)帶來(lái)巨大的損失。
3、重慶大數(shù)據(jù)更強(qiáng)調(diào)大數(shù)據(jù)的及時(shí)性
互聯(lián)網(wǎng)大數(shù)據(jù)在時(shí)效性方面沒有特殊的要求,其大數(shù)據(jù)是長(zhǎng)期積累,從中找出大數(shù)據(jù)中的相關(guān)性即可。而重慶大數(shù)據(jù)就更著重大數(shù)據(jù)的時(shí)效性了。如工業(yè)設(shè)備 的故障,廠房或生產(chǎn)的災(zāi)難性的故障,火災(zāi)、污染物的泄露等,這些不僅僅需要事后的補(bǔ)救,更為重要的是,工業(yè)互聯(lián)網(wǎng)需要在大數(shù)據(jù)提供和采集的基礎(chǔ)之上能給予提前預(yù)測(cè),發(fā)出預(yù)警,在災(zāi)難發(fā)生之前采取措施避免災(zāi)難的發(fā)生。
近年來(lái)由于大數(shù)據(jù)被用于生活和工作的方方面面,甚至有人曾說(shuō)未來(lái)的時(shí)代將不是IT時(shí)代,而是大數(shù)據(jù)的時(shí)代。大數(shù)據(jù)是重要,但卻也出現(xiàn)信息越多,就越靠近真相這樣的認(rèn)知,這就不應(yīng)該了?!禩he Signal and the Noise》(信號(hào)與噪聲,作者Nate Silver),這本書里面有一個(gè)觀點(diǎn):更多的大數(shù)據(jù)意味著更多的噪聲。信號(hào)是真相,噪聲卻使我們離真相越來(lái)越遠(yuǎn)。
所以,無(wú)論是互聯(lián)網(wǎng)大數(shù)據(jù)還是重慶互聯(lián)網(wǎng)大數(shù)據(jù),人們需要構(gòu)建有效的算法和模型,去識(shí)別和認(rèn)知何為真相,這樣,大數(shù)據(jù)才真正給我們的生活和工作帶來(lái)正面的影響。