隨著我國(guó)社會(huì)經(jīng)濟(jì)的發(fā)展、城市化進(jìn)程的加快,城市公共交通的規(guī)模也在不斷擴(kuò)大。如何更好地發(fā)展與管理城市公交,實(shí)現(xiàn)其社會(huì)效益最優(yōu)化,并最大限度地提高公交企業(yè)管理水平、提高公交車(chē)輛運(yùn)行效率,是目前面臨的現(xiàn)實(shí)問(wèn)題。
公交行業(yè)由于傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)的軟硬件擴(kuò)容成本過(guò)高(teradata、oracle、小型機(jī)等),導(dǎo)致單位數(shù)據(jù)存儲(chǔ)成本與總體計(jì)算成本過(guò)高,為應(yīng)對(duì)過(guò)高的 TCO(總體擁有成本),不得不對(duì)全量數(shù)據(jù)采取拆分存放,將大量歷史數(shù)據(jù)離線存儲(chǔ),進(jìn)而導(dǎo)致數(shù)據(jù)應(yīng)用的不便;而基于傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的報(bào)表式指標(biāo)數(shù)據(jù)加工 手段,往往遵從T+1原則(業(yè)務(wù)日下一日),對(duì)于實(shí)時(shí)統(tǒng)計(jì)分析場(chǎng)景也缺乏有力支撐。以上兩點(diǎn)不足,都嚴(yán)重制約了公交行業(yè)數(shù)據(jù)的縱深應(yīng)用。
如何更好地發(fā)展與管理城市公交,實(shí)現(xiàn)其社會(huì)效益最優(yōu)化,并最大限度地提高公交企業(yè)管理水平、提高公共交通運(yùn)行效率,是目前面公交行業(yè)面臨的現(xiàn)實(shí)問(wèn)題,而具體到實(shí)際應(yīng)用,則主要體現(xiàn)為以下幾個(gè)具體問(wèn)題:
政企協(xié)作問(wèn)題:
如何科學(xué)、準(zhǔn)確地評(píng)估公交財(cái)政投放總體資金規(guī)模?
如何科學(xué)、準(zhǔn)確地評(píng)估購(gòu)置車(chē)輛數(shù)量及對(duì)應(yīng)購(gòu)置費(fèi)用數(shù)額?
如何科學(xué)、準(zhǔn)確地評(píng)估存量車(chē)輛與增量車(chē)輛時(shí)間窗口內(nèi)的能耗情況,以及能耗對(duì)應(yīng)的財(cái)政補(bǔ)貼?
乘客滿意度問(wèn)題:
如何實(shí)時(shí)、準(zhǔn)確地進(jìn)行公交到站預(yù)測(cè),優(yōu)化客戶候車(chē)預(yù)期,提升客戶滿意度?
如何科學(xué)、智能地優(yōu)化公交車(chē)輛調(diào)度,進(jìn)而優(yōu)化線路運(yùn)力水平,優(yōu)化客戶體驗(yàn)?
如何科學(xué)、合理地劃分交通小區(qū),針對(duì)性配置社區(qū)“微循環(huán)”車(chē)輛,提升客戶出行感受?
精細(xì)化運(yùn)營(yíng)問(wèn)題:
如何精細(xì)化開(kāi)展運(yùn)營(yíng)監(jiān)測(cè)指標(biāo)體系?如計(jì)劃里程/實(shí)際里程、計(jì)劃配車(chē)/實(shí)際出車(chē)、計(jì)劃配班/實(shí)際配班。
如何精細(xì)化開(kāi)展運(yùn)營(yíng)分析指標(biāo)體系?如配車(chē)情況分析、公里情況分析、配班情況分析、能耗分析、資源利用分析。
如何精細(xì)化開(kāi)展實(shí)時(shí)監(jiān)測(cè)體系?如車(chē)輛狀態(tài)實(shí)時(shí)監(jiān)測(cè)、車(chē)輛位置實(shí)時(shí)監(jiān)測(cè)、車(chē)輛串車(chē)實(shí)時(shí)監(jiān)測(cè)預(yù)警、大間隔實(shí)時(shí)監(jiān)測(cè)預(yù)警、道路實(shí)時(shí)擁堵監(jiān)測(cè)。
而要解決這些問(wèn)題,一個(gè)強(qiáng)大的大數(shù)據(jù)支持平臺(tái)必不可少,同時(shí)對(duì)大數(shù)據(jù)解決方案的提供商也提出了不小的挑戰(zhàn)。而作為民族企業(yè)大數(shù)據(jù)代表的睿至數(shù)據(jù),一直以來(lái)都在持續(xù)關(guān)注公交行業(yè)的發(fā)展,并為公交行業(yè)提供了完善的大數(shù)據(jù)解決方案。
實(shí)際上,選擇什么樣的大數(shù)據(jù)技術(shù)平臺(tái)則對(duì)于解決公交行業(yè)面臨的上述問(wèn)題至關(guān)重要,由于Hadoop技術(shù)軟硬件體系擴(kuò)容成本較低(開(kāi)放技術(shù)、PC服務(wù)器),可 以大大降低單位數(shù)據(jù)存儲(chǔ)成本與計(jì)算成本,從而為全量數(shù)據(jù)在線,海量數(shù)據(jù)加工計(jì)算提供了先決條件;基于流數(shù)據(jù)的處理技術(shù),使數(shù)據(jù)在產(chǎn)生的過(guò)程中,持續(xù)加工、 匯總、分析,實(shí)時(shí)產(chǎn)生價(jià)值信息,為類(lèi)似實(shí)時(shí)斷面客流量統(tǒng)計(jì)、車(chē)輛滿載率分析、道路擁堵指數(shù)分析奠定了技術(shù)基礎(chǔ)??傃灾?,公交行業(yè)主要考量的是供應(yīng)商整體解 決方案的技術(shù)支撐能力和業(yè)務(wù)應(yīng)用能力兩大能力。技術(shù)支撐能力包括大數(shù)據(jù)平臺(tái)軟硬件橫向擴(kuò)展能力、擴(kuò)展成本增速、實(shí)時(shí)數(shù)據(jù)處理能力、數(shù)據(jù)處理規(guī)模能力;業(yè)務(wù) 應(yīng)用能力,包括除公交基礎(chǔ)指標(biāo)應(yīng)用外的數(shù)據(jù)挖掘模型類(lèi)應(yīng)用,如客流遷徙模型、新線開(kāi)通模型、定制公交模型等應(yīng)用。這兩大能力是公交大數(shù)據(jù)平臺(tái)建設(shè)過(guò)程中關(guān) 注的重點(diǎn)。
該項(xiàng)目中,睿至大數(shù)據(jù)做了很多模型,與公交行業(yè)充分結(jié)合,最終達(dá)到了很好的效果。這些模型包括了客流遷徒模型、職往模型、路網(wǎng)擁堵模型、職住平衡合理分布模型、乘客標(biāo)簽與組分分析模型、車(chē)輛經(jīng)濟(jì)壽命模型、車(chē)輛經(jīng)濟(jì)效益模型。
睿至公交大數(shù)據(jù)應(yīng)用平臺(tái)從探尋城市環(huán)境下公交交通運(yùn)行全局活動(dòng)出發(fā),匯集公交交通運(yùn)行過(guò)程中,政府管理部門(mén)、公交運(yùn)行企業(yè)、公眾出行參與方共三方面多渠道多 角度的信息,揭示城市核心功能區(qū)主干路網(wǎng)OD特性,分析預(yù)測(cè)乘客遷徙動(dòng)向,探究乘客流向與公交需求管理/線網(wǎng)規(guī)劃/線路開(kāi)通之間的匹配度,剖析交通流與公 交交通線路規(guī)劃/交通突發(fā)事件的相互影響,統(tǒng)籌分析公交線路規(guī)劃合理性,洞察新的乘客流動(dòng)趨勢(shì),探索公交面對(duì)突發(fā)事件的最優(yōu)化處理方案。具體功能涵蓋四個(gè) 專(zhuān)題、七個(gè)模型。
四個(gè)專(zhuān)題指人、車(chē)、線、站專(zhuān)題:
專(zhuān)題“人”指,以乘客為著眼點(diǎn),基于客流OD、斷面客流量、平均換乘、客運(yùn)量、平均乘距、出行連等關(guān)鍵指標(biāo),精準(zhǔn)刻畫(huà)城市客流時(shí)空流動(dòng)特性;
專(zhuān)題“車(chē)”指,以車(chē)輛為著眼點(diǎn),基于車(chē)輛能源消耗、故障率、車(chē)輛位置監(jiān)測(cè)、運(yùn)行監(jiān)測(cè)、維修成本、運(yùn)營(yíng)監(jiān)測(cè)等關(guān)鍵指標(biāo),科學(xué)指導(dǎo)內(nèi)部運(yùn)營(yíng),減少成本,提高效益;
專(zhuān)題“線”指,以公交線路、線網(wǎng)為著眼點(diǎn),基于城市交通熱區(qū)、交通熱點(diǎn)、道路難度系數(shù)、線路重合度、斷面負(fù)載等關(guān)鍵指標(biāo),科學(xué)指導(dǎo)新線、新站開(kāi)通;
專(zhuān)題“站”指,以公交站為著眼點(diǎn),基于分散公交站點(diǎn)的乘客登降量、中轉(zhuǎn)量、集散量、覆蓋度、不均衡系數(shù)等關(guān)鍵指標(biāo),探尋公交站點(diǎn)功能性特性及引力特征;
該平臺(tái)通過(guò)數(shù)據(jù)源層、數(shù)據(jù)采集與交換層、數(shù)據(jù)存儲(chǔ)與計(jì)算層、應(yīng)用層、門(mén)戶層的有機(jī)銜接來(lái)完成“數(shù)據(jù)”到“價(jià)值”的生產(chǎn)過(guò)程。數(shù)據(jù)源層包含公交業(yè)務(wù)運(yùn)營(yíng)過(guò)程中 的關(guān)鍵生產(chǎn)系統(tǒng),是數(shù)據(jù)產(chǎn)生的源頭。數(shù)據(jù)采集與交換層主要負(fù)責(zé)集中抽取數(shù)據(jù)源層各生產(chǎn)系統(tǒng)的數(shù)據(jù),并進(jìn)行統(tǒng)一整合和清洗,然后進(jìn)一步向數(shù)據(jù)存儲(chǔ)層傳遞。數(shù) 據(jù)存儲(chǔ)與計(jì)算層主要負(fù)責(zé)集中管理存儲(chǔ)整合、清洗后的全量數(shù)據(jù),同時(shí)提供基礎(chǔ)指標(biāo)加工、特征數(shù)據(jù)加工、業(yè)務(wù)建模運(yùn)算等計(jì)算能力,為數(shù)據(jù)應(yīng)用奠定了可靠、全 量、簡(jiǎn)易的數(shù)據(jù)基礎(chǔ)。應(yīng)用層指基于數(shù)據(jù)存儲(chǔ)層的數(shù)據(jù)所開(kāi)展的各類(lèi)數(shù)據(jù)挖掘、分析類(lèi)應(yīng)用。最后,門(mén)戶層提供數(shù)據(jù)應(yīng)用的統(tǒng)一認(rèn)證與授權(quán),保證了數(shù)據(jù)使用的安全 性。
睿至公交大數(shù)據(jù)應(yīng)用平臺(tái)具有以下功能:
通過(guò)早晚高峰客流遷徙規(guī)律數(shù)據(jù),可以實(shí)現(xiàn)精細(xì)化規(guī)劃調(diào)度排班。從而提升運(yùn)力,提高收益。定制直達(dá)公交。從而提升收益。
通過(guò)路網(wǎng)實(shí)時(shí)擁堵數(shù)據(jù),可以實(shí)現(xiàn)早晚高峰期間,公共車(chē)道和公交專(zhuān)用道的擁堵對(duì)比,通過(guò)影響出行市民乘坐公交,進(jìn)而提升運(yùn)力、增加效益。
通過(guò)職住平衡可視化模型,可以實(shí)現(xiàn)支持上級(jí)管理部門(mén),評(píng)估城市規(guī)劃合理性。優(yōu)化城市布局。定制交通小區(qū)間的直達(dá)公交,從而提高收益。定制以交通小區(qū)為節(jié)點(diǎn)的串聯(lián)區(qū)間公交,從而提高收益。
此外,客戶標(biāo)簽化,是公交精細(xì)化運(yùn)營(yíng)的基礎(chǔ),通過(guò)乘客標(biāo)簽化可進(jìn)一步實(shí)現(xiàn):
精細(xì)化客流預(yù)測(cè),即基于乘客上車(chē)時(shí)刻、在途時(shí)刻動(dòng)態(tài)預(yù)測(cè)客流;
通過(guò)乘客組分分析,掌握不同群體組成結(jié)構(gòu),從而指導(dǎo)差異化產(chǎn)品創(chuàng)新、產(chǎn)品定價(jià),進(jìn)一步提升總體效益;
基于乘客組成結(jié)構(gòu)、出行規(guī)律,支撐票務(wù)價(jià)格制定(最優(yōu)解),提高總體收益;
基于乘客組成的精準(zhǔn)廣告服務(wù),精準(zhǔn)廣告投放,包括車(chē)身廣告、車(chē)載視頻廣告等。
北京睿至大數(shù)據(jù)所提供的公交大數(shù)據(jù)平臺(tái)方案,深入貼合 公交業(yè)務(wù)特性,真正實(shí)現(xiàn)了公交數(shù)據(jù)的深度應(yīng)用。通過(guò)方案的落地實(shí)施,不僅打破了我們已有數(shù)據(jù)割裂式存放的困境,還發(fā)揮了數(shù)據(jù)全量在線的真正價(jià)值,通過(guò)交通 擁堵指數(shù)模型、客流遷徙模型、資產(chǎn)經(jīng)濟(jì)壽命模型、盈利刻畫(huà)模型的投產(chǎn)應(yīng)用,使數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新成為可能,使數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)成為可能,也使數(shù)據(jù)創(chuàng)造收益成為可能。 在部署了該技術(shù)方案后,精確掌握了全市客流在早、晚高峰的時(shí)空流動(dòng)特性。并基于該模型實(shí)現(xiàn)了定制公交、直達(dá)公交、智能調(diào)度等多項(xiàng)創(chuàng)新應(yīng)用,助力決策層由 “經(jīng)驗(yàn)型判斷”向“精確型判斷”邁出了一大步。同時(shí),定制公交和直達(dá)公交在滿足城市公共出行服務(wù)的基礎(chǔ)之上,實(shí)現(xiàn)了較好的營(yíng)業(yè)收入,在全市全轄所有線路 中,排名整體靠前。
在方案落地初期,過(guò)重的強(qiáng)調(diào)的業(yè)務(wù)交付速度,忽視了數(shù)據(jù)治理基礎(chǔ)工作的重要性,導(dǎo)致正確的業(yè) 務(wù)模型和算法產(chǎn)出了有悖業(yè)務(wù)常識(shí)的計(jì)算結(jié)果。雖然經(jīng)過(guò)持續(xù)深入的數(shù)據(jù)血緣追溯,找出了問(wèn)題的根源(數(shù)據(jù)質(zhì)量問(wèn)題),并最終糾正了數(shù)據(jù)產(chǎn)出結(jié)果,但數(shù)據(jù)排錯(cuò) 過(guò)程中付出了大量重復(fù)的工作量。所以,數(shù)據(jù)治理(元數(shù)據(jù)與數(shù)據(jù)質(zhì)量)是數(shù)據(jù)應(yīng)用的可靠保障,只有正確的數(shù)據(jù)輸入才能保證正確的價(jià)值輸出。
同時(shí),在項(xiàng)目實(shí)施的過(guò)程中所遇到的主要問(wèn)題是數(shù)據(jù)增長(zhǎng)速度預(yù)估不足,數(shù)據(jù)應(yīng)用過(guò)程中的所導(dǎo)致的數(shù)據(jù)膨脹空間預(yù)估不夠,同時(shí),數(shù)據(jù)量的增長(zhǎng)過(guò)快又必然帶來(lái)計(jì)算 資源的緊張。針對(duì)以上問(wèn)題,采取的手段是持續(xù)擴(kuò)展大數(shù)據(jù)集群規(guī)模,然后進(jìn)行數(shù)據(jù)再平衡分布(rebalance),雖然集群數(shù)據(jù)再平衡耗時(shí)較長(zhǎng),但完美解 決了應(yīng)對(duì)數(shù)據(jù)快速增長(zhǎng)所帶來(lái)的技術(shù)挑戰(zhàn)。