大型企業(yè)網(wǎng)絡(luò)數(shù)據(jù)時(shí)代
企業(yè)被牢牢嵌入權(quán)力和控制網(wǎng)絡(luò)中,它們共享公司董事會成員(建立緊密聯(lián)系的董事會)、所有者和股份。大量文獻(xiàn)表明,通過模仿和學(xué)習(xí),這些網(wǎng)絡(luò)有利于企業(yè)管理慣例和實(shí)踐經(jīng)驗(yàn)在董事會之間傳播。作為一種溝通結(jié)構(gòu),網(wǎng)絡(luò)促進(jìn)了現(xiàn)有信念和思想的復(fù)制,以及新信念和思想的傳播。長期以來,這些網(wǎng)絡(luò)形成了獨(dú)特的國家商業(yè)圈,并成為國家經(jīng)濟(jì)組織的一部分。然而,它們正逐漸超越國家層面,形成一個(gè)新且復(fù)雜的企業(yè)所有權(quán)和控制權(quán)的全球體系。
就在幾年前,學(xué)者們還需要從“財(cái)富”500強(qiáng)等名單中靠人工識別出“100強(qiáng)”跨國企業(yè),用來評估跨國精英關(guān)系的狀況。對歐洲等特定地區(qū)的精英網(wǎng)絡(luò)結(jié)構(gòu)研究往往包括幾十或幾百家大企業(yè)?,F(xiàn)在,學(xué)者們開始將研究范圍擴(kuò)大到全球領(lǐng)域,如列出世界上最大的100萬家企業(yè),或在全球企業(yè)控制結(jié)構(gòu)中,從3000萬家企業(yè)里篩選出最重要的60萬家跨國企業(yè)。作者將其稱之為大型企業(yè)網(wǎng)絡(luò)數(shù)據(jù)(big corporate network data,以下簡稱BCND)的出現(xiàn)。
當(dāng)前大數(shù)據(jù)研究仍面臨諸多挑戰(zhàn)。本文的目的不是提出一個(gè)具體的技術(shù)解決方案,而是進(jìn)行元方法干預(yù)。本研究集合了來自六個(gè)不同國家的12所大學(xué)的國際學(xué)者的共同努力。經(jīng)過多次雙邊討論后,學(xué)者們在企業(yè)精英研究背景下如何解決大數(shù)據(jù)質(zhì)量問題上達(dá)成了共識,提出一個(gè)用于處理BCND問題的標(biāo)準(zhǔn)流程。
大型企業(yè)網(wǎng)絡(luò)數(shù)據(jù):特征和問題
傳統(tǒng)上,大數(shù)據(jù)具有“3Vs”特征,即大量(volume)、高速(velocity)和多樣性(variety)。最近,一些學(xué)者又提出了兩個(gè)特征,即準(zhǔn)確性(veracity)和多變性(variability)。作者以這五個(gè)特點(diǎn)為框架,分析使用BCND時(shí)遇到的問題。
數(shù)量大是大數(shù)據(jù)最廣為人知的特征,作者認(rèn)為該特征本身在BCND中沒有問題。如何處理與分析數(shù)據(jù)是大數(shù)據(jù)研究面臨的挑戰(zhàn)。本文不關(guān)注這些技術(shù)問題,因?yàn)樽髡哒J(rèn)為,大數(shù)據(jù)和社會科學(xué)之間的整合與科技能力有關(guān),這種認(rèn)知是有問題的。當(dāng)然,在BCND范圍內(nèi),數(shù)據(jù)量確實(shí)比以前要大,但現(xiàn)有的工具和技術(shù)是可以對其進(jìn)行管理的。然而,數(shù)據(jù)量改變了研究者與數(shù)據(jù)的關(guān)系,進(jìn)而導(dǎo)致了一些與其他特征有關(guān)的(分析性)問題。
第一,BCND提供了多樣化的信息。為了存儲信息,研究人員使用了不同類型的結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)通常缺乏通用的統(tǒng)一標(biāo)識。雖然豐富性是這些數(shù)據(jù)的優(yōu)點(diǎn),但不同的數(shù)據(jù)源——甚至在不同時(shí)間點(diǎn)上的同一數(shù)據(jù)源——可能不會使用相同的規(guī)則來對數(shù)據(jù)進(jìn)行收集和編碼。此外,多樣性意味著在不同的數(shù)據(jù)集或時(shí)間點(diǎn)上,數(shù)據(jù)之間的可比性和完整性可能會不一致。因此,除了解數(shù)據(jù)的生成過程之外,人們用來收集、整理和存儲數(shù)據(jù)的機(jī)制也越來越重要。而且,掌握特殊信息的人并不總是愿意共享這些信息。所以,BCND的另一個(gè)關(guān)鍵挑戰(zhàn)是評估數(shù)據(jù)的完整性。
第二,傳統(tǒng)意義上,高速是指除了數(shù)據(jù)量大以外,數(shù)據(jù)流還可以持續(xù)不斷地從各種資源處匯入。BCND源數(shù)據(jù)庫幾乎是持續(xù)更新的,因此隨著時(shí)間的推移,數(shù)據(jù)的變化也很快。但這也意味著數(shù)據(jù)庫的某些部分可能在更新,而另一部分不更新。在BCND的例子中,我們可以看到,國家越發(fā)達(dá)、越富裕,注冊的公司越多,數(shù)據(jù)增長的速度越快。所以,在與其他國家進(jìn)行比較時(shí),可能會導(dǎo)致比較偏差。換言之,BCND的高速會導(dǎo)致準(zhǔn)確性問題。
第三,準(zhǔn)確性指向數(shù)據(jù)的質(zhì)量往往模糊不清這一事實(shí)。這涉及數(shù)據(jù)的來源問題,包括數(shù)據(jù)收集的起點(diǎn)、創(chuàng)建和傳輸過程,以及數(shù)據(jù)擴(kuò)展和優(yōu)先順序的一般邏輯。數(shù)據(jù)是通過多種方式收集的,通常情況下,正規(guī)的收集協(xié)議是不公開的,故而難以對其進(jìn)行徹底審核。因此,這也導(dǎo)致了人們對其準(zhǔn)確性和完整性的關(guān)注。
最后,多變性是指,使用者解釋數(shù)據(jù)的方式可能會隨著時(shí)間推移或根據(jù)研究問題發(fā)生改變。數(shù)據(jù)的使用要求我們了解數(shù)據(jù)是如何構(gòu)成的。由于BCND的多變性,研究人員必須清楚其分析單位。雖然所有的研究都是如此,但作者認(rèn)為,使用大數(shù)據(jù),特別是BCND,由于數(shù)據(jù)收集不是針對研究問題量身定做的,故而出錯(cuò)的風(fēng)險(xiǎn)會增加。在實(shí)踐中,我們經(jīng)??吹窖芯咳藛T設(shè)計(jì)的研究問題試圖充分利用新數(shù)據(jù)源的潛力。這本身并不是問題,但意味著研究人員可能會傾向于使用數(shù)據(jù)結(jié)構(gòu)中的單位或字段作為研究對象。因此,必須仔細(xì)考慮現(xiàn)有的BCND是否確實(shí)與適合的分析單位相對應(yīng)。
表1:大數(shù)據(jù)的特征映射到企業(yè)網(wǎng)絡(luò)分析中的問題
大型企業(yè)網(wǎng)絡(luò)數(shù)據(jù)的診斷與修復(fù)
步驟1,確定分析單位:包括分析單位的問題;分析單位的診斷;分析單位問題的修正。
步驟2,檢查實(shí)體歧義:包括實(shí)體歧義的問題是什么?實(shí)體歧義的診斷;實(shí)體歧義的處理。
步驟3,完整性:數(shù)據(jù)完整性問題;完整性診斷。
步驟4,準(zhǔn)確性:數(shù)據(jù)準(zhǔn)確性問題;準(zhǔn)確性診斷;解決準(zhǔn)確性問題。
(本部分原文篇幅較長,內(nèi)容詳盡,出于篇幅和閱讀性考慮,推送中僅簡要列出其結(jié)構(gòu))
結(jié)語
在本文中,針對大企業(yè)網(wǎng)絡(luò)數(shù)據(jù)(BCND)的使用問題,作者進(jìn)行了數(shù)據(jù)質(zhì)量研究。他們提出了一個(gè)框架,該框架不僅可以作為研究人員的向?qū)В以诮窈蟮?FONT style=>數(shù)據(jù)質(zhì)量和處理方法方面有指導(dǎo)意義。研究人員應(yīng)確定數(shù)據(jù)是否符合分析單位;處理實(shí)體歧義、數(shù)據(jù)完整性和數(shù)據(jù)準(zhǔn)確性;公布這些步驟及其診斷和修復(fù)方法。本文介紹了用于診斷BCND問題嚴(yán)重性的新工具和技術(shù),以及處理這些問題的特定技術(shù)和修復(fù)方法。具體來說,在Figure 1的每個(gè)階段中,作者都提供了一套用于識別、解決或最小化已知會出現(xiàn)的BCND問題的最佳方案。
大型企業(yè)網(wǎng)絡(luò)數(shù)據(jù)的前景遠(yuǎn)遠(yuǎn)超出了一些描述性的貢獻(xiàn),如全球企業(yè)控制集中度的提高(Vitali et al. 2011);迄今為止無視董事會連鎖網(wǎng)絡(luò)的多級性質(zhì)(Heemskerk et al. 2016);三大被動投資者在全球股市中前所未有的股東權(quán)力地位(Fichtner et al. 2017)。作者指出,未來研究的關(guān)鍵步驟應(yīng)包括:利用先進(jìn)的大數(shù)據(jù)建??蚣?,了解網(wǎng)絡(luò)動態(tài)背后的驅(qū)動力,并最終準(zhǔn)確描述出新模式的經(jīng)濟(jì)、政治和社會后果。然而如果不先解決BCND問題,就無法系統(tǒng)地做出這些貢獻(xiàn)。