“全國(guó)各省市三百多行業(yè)數(shù)據(jù)信息采集”、“python爬蟲(chóng)程序數(shù)據(jù)采集代寫(xiě)軟件,專(zhuān)業(yè)老手,定制化服務(wù)”……在某二手交易平臺(tái)上,有不少提供所謂“大數(shù)據(jù)”采集信息服務(wù)的商家,聲稱(chēng)可進(jìn)行“專(zhuān)業(yè)爬蟲(chóng)”、“各大網(wǎng)站數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)分析”,還有商家叫賣(mài)數(shù)據(jù)信息采集器,購(gòu)買(mǎi)軟件“無(wú)限量”導(dǎo)數(shù)據(jù)還幫忙介紹“客戶(hù)。
南都記者調(diào)查發(fā)現(xiàn),數(shù)據(jù)采集業(yè)務(wù)“風(fēng)光無(wú)限”的背后,隱藏著一條非法爬取用戶(hù)數(shù)據(jù)的黑色產(chǎn)業(yè)鏈——“專(zhuān)業(yè)老手”編寫(xiě)爬蟲(chóng)軟件、提供軟件訂制服務(wù)、黑產(chǎn)團(tuán)伙購(gòu)買(mǎi)軟件批量生成“大數(shù)據(jù)”信息再轉(zhuǎn)手出售。業(yè)內(nèi)專(zhuān)家指出,非法爬取數(shù)據(jù)存在法律風(fēng)險(xiǎn),未經(jīng)平臺(tái)授權(quán)爬取數(shù)據(jù)信息可能構(gòu)成侵權(quán)、違法甚至犯罪行為。
被公開(kāi)叫賣(mài)的“大數(shù)據(jù)”信息
網(wǎng)貸、教育培訓(xùn)信息、淘寶記錄……各行業(yè)數(shù)據(jù)“訂制”可查
在某二手交易平臺(tái)上,以“大數(shù)據(jù)信息采集”、“數(shù)據(jù)爬取”、“數(shù)據(jù)爬蟲(chóng)”等為關(guān)鍵詞在平臺(tái)上進(jìn)行搜索,有眾多提供所謂“大數(shù)據(jù)”采集信息服務(wù)的賣(mài)家。這些賣(mài)家通常打著“數(shù)據(jù)爬蟲(chóng)”、“數(shù)據(jù)采集”、“數(shù)據(jù)分析”的招牌,聲稱(chēng)可進(jìn)行“專(zhuān)業(yè)爬蟲(chóng)”、“各大網(wǎng)站數(shù)據(jù)采集、數(shù)據(jù)處理”。
“全國(guó)各省市三百多行業(yè)數(shù)據(jù)信息采集”,二手平臺(tái)上一位賣(mài)家稱(chēng)。據(jù)其在商品介紹處列出的行業(yè)類(lèi)別,數(shù)據(jù)信息采集范圍覆蓋美容美發(fā)、餐飲美食、娛樂(lè)休閑、教育培訓(xùn)、親子護(hù)理、各類(lèi)學(xué)校、醫(yī)療保健、物流快遞、建材裝修、汽車(chē)數(shù)碼等行業(yè),售價(jià)為49元/市/行業(yè),拍下后留下郵箱,采集的數(shù)據(jù)可當(dāng)晚11點(diǎn)前發(fā)送到郵箱。
這些所謂的可爬取的“大數(shù)據(jù)”信息都包括哪些內(nèi)容?二手平臺(tái)上一位賣(mài)家告訴南都記者,他們可進(jìn)行數(shù)據(jù)采集的范圍涵蓋各類(lèi)網(wǎng)頁(yè)數(shù)據(jù)、公眾號(hào)網(wǎng)站、趕集58、鏈家、餓了么等網(wǎng)站平臺(tái)的用戶(hù)個(gè)人信息,還有賣(mài)家稱(chēng)可采集“淘寶買(mǎi)家、商家信息”、“WD最新一手實(shí)時(shí)申請(qǐng)數(shù)據(jù)”(注:WD為“網(wǎng)貸”拼音縮寫(xiě))。
而根據(jù)數(shù)據(jù)采集的難易程度,價(jià)格也不同。前述告訴南都記者,數(shù)據(jù)采集服務(wù)“基本版的100,普通版的200,高級(jí)版的300,如需制作客戶(hù)端軟件,費(fèi)用另加”。交易平臺(tái)數(shù)據(jù)顯示,該商品近期已被瀏覽超過(guò)3000次,有多名網(wǎng)友在該商品下方留言,詢(xún)問(wèn)是否有唯品會(huì)、拼多多買(mǎi)家、58同城應(yīng)聘者電話(huà)、小區(qū)業(yè)主等信息數(shù)據(jù),賣(mài)家表示可以提供,簡(jiǎn)歷有“420萬(wàn)份,主要是中高端用戶(hù)”,并稱(chēng)具體業(yè)務(wù)“私聊”。
南都記者發(fā)現(xiàn),這些所謂提供“大數(shù)據(jù)”信息采集服務(wù)的賣(mài)家有的個(gè)人、有的則是團(tuán)隊(duì)化操作的工作室,有賣(mài)家稱(chēng)這類(lèi)數(shù)據(jù)采集在行業(yè)內(nèi)業(yè)務(wù)需求量大,是“微商線(xiàn)上微信社群營(yíng)銷(xiāo)必備數(shù)據(jù)資料”,可用于精準(zhǔn)推廣、拓展客戶(hù)和商品營(yíng)銷(xiāo)。
除了爬取各行業(yè)用戶(hù)個(gè)人信息外,南都記者還注意到,一些付費(fèi)網(wǎng)站的內(nèi)容也同樣能被各類(lèi)“大數(shù)據(jù)”軟件采集到,二手平臺(tái)上不少賣(mài)家聲稱(chēng)可提供知網(wǎng)、萬(wàn)方、知識(shí)庫(kù)、等文獻(xiàn)期刊的數(shù)據(jù)抓取采集。此外,可公開(kāi)查詢(xún)的裁判文書(shū)網(wǎng)判決文書(shū),也被當(dāng)做商品出現(xiàn)在二手交易平臺(tái),有賣(mài)家稱(chēng)可通過(guò)數(shù)據(jù)爬蟲(chóng),提取到幾百萬(wàn)甚至上千萬(wàn)條裁判文書(shū)網(wǎng)判決文書(shū)。
此前,有不少用戶(hù)反映裁判文書(shū)網(wǎng)網(wǎng)站運(yùn)行速度慢,故障頻繁,經(jīng)常出現(xiàn)頁(yè)面無(wú)法顯示的問(wèn)題,今年2月,最高人民法院在其官網(wǎng)答復(fù)稱(chēng),出現(xiàn)此問(wèn)題的原因在于,此前有大量技術(shù)公司通過(guò)爬蟲(chóng)系統(tǒng)無(wú)限制并發(fā)訪(fǎng)問(wèn)非法獲取裁判文書(shū)數(shù)據(jù),造成網(wǎng)站負(fù)荷過(guò)大。針對(duì)此問(wèn)題,最高法表示自2018年7月起以驗(yàn)證碼的方式上線(xiàn)系統(tǒng)軟件防爬功能。
知名招聘網(wǎng)站上萬(wàn)份簡(jiǎn)歷被打包出售,每份僅1.5元
不久前,智聯(lián)招聘“內(nèi)鬼”私賣(mài)16萬(wàn)份簡(jiǎn)歷信息一案引發(fā)關(guān)注。據(jù)了解,該案涉及的個(gè)人簡(jiǎn)歷超過(guò)16萬(wàn)份。南都記者近日調(diào)查發(fā)現(xiàn),網(wǎng)售個(gè)人簡(jiǎn)歷“業(yè)務(wù)”同樣火爆,簡(jiǎn)歷“黑市”里上萬(wàn)份簡(jiǎn)歷被打包出售,每份僅1.5元。
“智聯(lián)招聘簡(jiǎn)歷,全國(guó)各地區(qū)都有”、“長(zhǎng)期售賣(mài)58趕集全國(guó)簡(jiǎn)歷價(jià)格優(yōu)惠”、“北京全國(guó)簡(jiǎn)歷下載,主要下載智聯(lián)、前程,也可群內(nèi)交換簡(jiǎn)歷”……在qq群、貼吧、二手交易平臺(tái)上,有不少公開(kāi)出售智聯(lián)招聘、58同城、BOSS直聘等招聘網(wǎng)站上個(gè)人簡(jiǎn)歷的帖子。僅以“簡(jiǎn)歷售賣(mài)”、“簡(jiǎn)歷下載”為關(guān)鍵詞在qq群中搜索,就能找到多個(gè)出售58同城、智聯(lián)招聘等知名招聘網(wǎng)站的簡(jiǎn)歷信息的qq群,最大的群人數(shù)有上千人。
“全國(guó)58簡(jiǎn)歷每天日產(chǎn)5000+,可以篩選年齡篩選重復(fù),還有純二手簡(jiǎn)歷,可出視頻驗(yàn)證,二手0.3元/條”,在一個(gè)名叫“58簡(jiǎn)歷全國(guó)交流群”中,南都記者看到,群內(nèi)不斷有人發(fā)布出售知名招聘網(wǎng)站簡(jiǎn)歷實(shí)時(shí)一手、二手信息的帖子,有的賣(mài)家還在群內(nèi)交流互換資源。群內(nèi)信息顯示,該群群成員總計(jì)超過(guò)2千人,高峰期的在線(xiàn)人數(shù)超過(guò)700人。
南都記者隨機(jī)添加一位賣(mài)家為qq好友,對(duì)方稱(chēng)他有全國(guó)各行業(yè)各地區(qū)的簡(jiǎn)歷信息,“所有簡(jiǎn)歷信息都是當(dāng)天實(shí)時(shí)更新”,還可以指定求職者年齡、性別、地區(qū),售價(jià)2.2元/條,而二手的則更便宜,僅售0.3元/條。
隨后,南都記者再隨機(jī)聯(lián)系二手平臺(tái)上一位售賣(mài)簡(jiǎn)歷的賣(mài)家,對(duì)方稱(chēng)他手上有上萬(wàn)份簡(jiǎn)歷,“58同城、智聯(lián)招聘、趕集網(wǎng)的都有”,每份簡(jiǎn)歷售價(jià)1.5元,“全國(guó)隨機(jī),不指定地區(qū)”,購(gòu)買(mǎi)量大價(jià)格還可以再優(yōu)惠。
南都記者了解到,這些公開(kāi)售賣(mài)、明碼標(biāo)價(jià)的個(gè)人信息,根據(jù)地域、行業(yè)類(lèi)別的不同,簡(jiǎn)歷的價(jià)格標(biāo)準(zhǔn)也不一樣。二手平臺(tái)上一位出售智聯(lián)招聘簡(jiǎn)歷的賣(mài)家告訴南都記者,“北上廣都比較貴”、“北京地區(qū)每份簡(jiǎn)歷要賣(mài)六七塊”。而除出售簡(jiǎn)歷信息外,企業(yè)賬號(hào)也可以被當(dāng)成商品出售或轉(zhuǎn)賣(mài),有賣(mài)家告訴記者,購(gòu)買(mǎi)企業(yè)賬號(hào)可以直接下載招聘網(wǎng)站求職者投遞的簡(jiǎn)歷信息,“地區(qū)行業(yè)你說(shuō)了算”。
當(dāng)記者詢(xún)問(wèn)購(gòu)買(mǎi)簡(jiǎn)歷的人拿這些個(gè)人信息去做什么,賣(mài)家提高了警惕,回復(fù)稱(chēng)“不管你拿去干什么”,還不耐煩地表示“不用跟說(shuō)這個(gè)”,隨后便把記者設(shè)拉進(jìn)了黑名單。
非法爬取數(shù)據(jù)信息的黑產(chǎn)生意
“專(zhuān)業(yè)老手”代寫(xiě)爬蟲(chóng)軟件,各行業(yè)數(shù)據(jù)信息“按需定制”
網(wǎng)售“大數(shù)據(jù)”信息如此猖獗,這些所謂的“大數(shù)據(jù)”信息從何而來(lái)?又是如何被泄露出去的?智聯(lián)招聘“內(nèi)鬼”私賣(mài)16萬(wàn)份簡(jiǎn)歷信息一案揭開(kāi)了數(shù)據(jù)泄露的冰山一角。
南都記者調(diào)查發(fā)現(xiàn),數(shù)據(jù)采集業(yè)務(wù)“風(fēng)光無(wú)限”的背后,隱藏著一條非法爬取用戶(hù)數(shù)據(jù)的黑色產(chǎn)業(yè)鏈——“專(zhuān)業(yè)老手”編寫(xiě)爬蟲(chóng)軟件、提供軟件訂制服務(wù)、黑產(chǎn)團(tuán)伙購(gòu)買(mǎi)軟件批量生成數(shù)據(jù)信息再轉(zhuǎn)手出售。
所謂爬蟲(chóng),是一種常見(jiàn)的數(shù)據(jù)捕獲技術(shù),又被稱(chēng)為網(wǎng)頁(yè)蜘蛛,網(wǎng)絡(luò)機(jī)器人,其按照一定的規(guī)則,自動(dòng)從互聯(lián)網(wǎng)上提取網(wǎng)絡(luò)信息的程序或腳本。當(dāng)前信息網(wǎng)絡(luò)環(huán)境下,利用爬蟲(chóng)軟件等各種技術(shù)手段爬取互聯(lián)網(wǎng)數(shù)據(jù)的行為廣泛存在。與此同時(shí),為保護(hù)自身數(shù)據(jù)不被爬取,很多企業(yè)也都設(shè)置了反爬蟲(chóng)策略。
“python爬蟲(chóng)程序數(shù)據(jù)采集代寫(xiě)軟件,專(zhuān)業(yè)老手,定制化服務(wù)”,二手平臺(tái)上一位賣(mài)家介紹,其提供各類(lèi)數(shù)據(jù)采集軟件代寫(xiě)訂制服務(wù),軟件采集數(shù)據(jù)可涵蓋攜程春秋航空等旅游網(wǎng)、美團(tuán)天貓京東拼多多、微博知乎豆瓣等電商社交平臺(tái)。
該賣(mài)家告訴南都記者,軟件的開(kāi)發(fā)團(tuán)隊(duì)“由一批精通軟件開(kāi)發(fā)的編程高手組成”,按需要可提供各類(lèi)數(shù)據(jù)爬取軟件訂制服務(wù),并可進(jìn)行“各種加密網(wǎng)站破解登陸”。平臺(tái)信息顯示,該賣(mài)家近期完成多筆交易,用戶(hù)反饋“好評(píng)如潮”。
“網(wǎng)絡(luò)數(shù)據(jù)訂制 云端代采集 京東淘寶 車(chē)主 金融等所有行業(yè)信息采集,拍下發(fā)軟件”,二手平臺(tái)上一位賣(mài)家介紹。據(jù)該賣(mài)家提供的軟件演示視頻顯示,這是一款名叫“智能云”的軟件,售價(jià)980元,可采集的數(shù)據(jù)信息覆蓋地圖商家、搜索引擎、企業(yè)信息、車(chē)主信息等全網(wǎng)大數(shù)據(jù),軟件有導(dǎo)入微信通訊錄、qq群成員提取、微信群發(fā)、微信營(yíng)銷(xiāo)、qq營(yíng)銷(xiāo)、論壇營(yíng)銷(xiāo)等多個(gè)功能界面。賣(mài)家介紹稱(chēng),該軟件可用來(lái)為各行業(yè)進(jìn)行大數(shù)據(jù)引流、實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)。
簡(jiǎn)歷采集器700元/套“無(wú)限”導(dǎo),有商家稱(chēng)可介紹“客戶(hù)”
除提供信息定制服務(wù)外,南都記者調(diào)查發(fā)現(xiàn),網(wǎng)上還有商家出售所謂簡(jiǎn)歷信息采集器,這類(lèi)軟件可自動(dòng)爬取知名招聘網(wǎng)站上的用戶(hù)個(gè)人簡(jiǎn)歷信息。
在qq群“58趕集簡(jiǎn)歷采集”中,qq網(wǎng)友“無(wú)名”稱(chēng)簡(jiǎn)歷采集器可“無(wú)限量”導(dǎo)出58同城求職者的個(gè)人簡(jiǎn)歷信息,信息“全網(wǎng)實(shí)時(shí)同步”?!懊?、電話(huà)、需要的工作、家庭地址都有,兼職全職都有”,還發(fā)來(lái)軟件操作的視頻截圖。
“我今天產(chǎn)了7千,賺了550”,賣(mài)家告訴南都記者,他就是用這個(gè)軟件從招聘網(wǎng)站導(dǎo)出個(gè)人簡(jiǎn)歷信息,然后在網(wǎng)上售賣(mài),“一手1.5元,二手0.3元”。賣(mài)家還向記者打包票,這款軟件“能賺錢(qián)”、“好用”、“質(zhì)量嘎嘎的”、“客戶(hù)天天找我”,并表示如果買(mǎi)了這個(gè)軟件,他還可幫忙介紹“客戶(hù)”。
南都記者注意到,商家出售的上述簡(jiǎn)歷信息采集器主要是針對(duì)58同城,而在2017年,也曾爆出過(guò)網(wǎng)售58簡(jiǎn)歷采集器造成網(wǎng)站大量用戶(hù)個(gè)人簡(jiǎn)歷泄露。不少提供售賣(mài)簡(jiǎn)歷信息采集器的賣(mài)家告訴南都記者,簡(jiǎn)歷采集器“趕集網(wǎng)和智聯(lián)招聘比較少”。
那么,這類(lèi)簡(jiǎn)歷信息采集器是如何批量爬取招聘網(wǎng)站的用戶(hù)個(gè)人簡(jiǎn)歷呢?有業(yè)內(nèi)專(zhuān)家就此分析過(guò)58簡(jiǎn)歷信息采集器的“盜取手法”:黑產(chǎn)團(tuán)伙利用58同城在移動(dòng)端的一個(gè)接口批量獲取用戶(hù)的簡(jiǎn)歷ID以及加密不嚴(yán)謹(jǐn)?shù)挠脩?hù)ID信息,再通過(guò)另一個(gè)接口導(dǎo)致用戶(hù)包括姓名等真實(shí)信息泄漏,最后通過(guò)58的微店程序能夠通過(guò)用戶(hù)ID最終獲取用戶(hù)的電話(huà)號(hào)碼。
采訪(fǎng)過(guò)程中,有商家還提醒南都記者,網(wǎng)售簡(jiǎn)歷信息采集器也有優(yōu)劣之分,有商家的軟件是用搭建好的數(shù)據(jù)庫(kù),可供提取的數(shù)據(jù)一共才幾千條,并不能實(shí)時(shí)導(dǎo)出網(wǎng)站有效數(shù)據(jù)。
一位出售58簡(jiǎn)歷信息采集器的qq網(wǎng)友“大神-售58簡(jiǎn)歷采集器”向南都記者表示,他的軟件可實(shí)時(shí)導(dǎo)出58同城、趕集網(wǎng)簡(jiǎn)歷數(shù)據(jù),采用的是“雙接口”和爬蟲(chóng)技術(shù),軟件安裝在PC端后,設(shè)置好條件便可進(jìn)行實(shí)時(shí)數(shù)據(jù)導(dǎo)出,“上手快好操作”,售價(jià)為700元/月。根據(jù)賣(mài)家發(fā)來(lái)的視頻截圖,這種簡(jiǎn)歷采集器設(shè)有城市、兼職崗位、性別、年齡和發(fā)布時(shí)間等篩選條件,采集到的數(shù)據(jù)包括姓名、手機(jī)號(hào)碼、學(xué)歷信息、工作年限、期待月薪等個(gè)人信息。
非法爬蟲(chóng)竊取“大數(shù)據(jù)”信息已成公司化運(yùn)營(yíng)
爬蟲(chóng)竊取用戶(hù)信息再加以售賣(mài)盈利的現(xiàn)象在業(yè)內(nèi)普遍存在
國(guó)家網(wǎng)信辦去年發(fā)布的《2017年數(shù)字中國(guó)建設(shè)發(fā)展報(bào)告》顯示,2014-2017年,中國(guó)大數(shù)據(jù)產(chǎn)業(yè)持續(xù)高速增長(zhǎng)。2017年中國(guó)大數(shù)據(jù)產(chǎn)業(yè)規(guī)模達(dá)到4700億元,同比增長(zhǎng)30%,預(yù)計(jì)2020年中國(guó)大數(shù)據(jù)市場(chǎng)產(chǎn)值將超萬(wàn)億。
看似風(fēng)光無(wú)限的大數(shù)據(jù)行業(yè),其背后的大數(shù)據(jù)殺熟、隱私安全、非法爬取用戶(hù)信息等亂象早已暴露無(wú)疑。有數(shù)據(jù)運(yùn)營(yíng)行業(yè)人士指出,通過(guò)爬蟲(chóng)等技術(shù)竊取用戶(hù)信息、再加以售賣(mài)盈利的現(xiàn)象在行業(yè)內(nèi)很普遍。
去年8月,南都記者報(bào)道了浙江紹興越城警方偵破“史上最大規(guī)模數(shù)據(jù)竊取案”,警方阻止遭竊取的30億條公民信息泄露。涉案的瑞智華勝等三家公司通過(guò)與網(wǎng)絡(luò)運(yùn)營(yíng)商合作的機(jī)會(huì),獲取運(yùn)營(yíng)商服務(wù)器登錄許可,并通過(guò)技術(shù)手段從運(yùn)營(yíng)商服務(wù)器抓取采集網(wǎng)絡(luò)用戶(hù)的登陸cookie數(shù)據(jù),進(jìn)而非法登陸網(wǎng)絡(luò)用戶(hù)的淘寶、微博等賬號(hào),獲取最前端的公民個(gè)人信息,并進(jìn)行強(qiáng)制加粉、訂單爬取等行為,從中牟利,公司年?duì)I收超過(guò)3000萬(wàn)元。
有互聯(lián)網(wǎng)安全專(zhuān)家指出,從運(yùn)營(yíng)商的層面進(jìn)行流量劫持和清洗,相當(dāng)于從源頭上數(shù)據(jù)就丟失了,位于下游的互聯(lián)網(wǎng)公司的安全防護(hù)能力再?gòu)?qiáng),也無(wú)法防范。
去年8月,南都聯(lián)合阿里安全部發(fā)布的《2018網(wǎng)絡(luò)黑灰產(chǎn)治理研究報(bào)告》顯示,2017年我國(guó)網(wǎng)絡(luò)安全產(chǎn)業(yè)規(guī)模為450多億元,而黑灰產(chǎn)已達(dá)近千億元規(guī)模,用戶(hù)信息泄露、網(wǎng)絡(luò)黑客勒索和通訊信息詐騙等問(wèn)題仍頻繁出現(xiàn)。
而在網(wǎng)絡(luò)黑灰產(chǎn)的整條產(chǎn)業(yè)鏈中,利用各種手段爬取、竊取或者通過(guò)買(mǎi)賣(mài)的方式獲得個(gè)人信息,成為黑灰產(chǎn)獲利的主要方式,由此滋生出的電信詐騙、敲詐勒索等下游違法犯罪行為,對(duì)公民個(gè)人信息安全、財(cái)產(chǎn)安全造成嚴(yán)重威脅,成為侵蝕互聯(lián)網(wǎng)經(jīng)濟(jì)正常運(yùn)轉(zhuǎn)的毒瘤。據(jù)不完全統(tǒng)計(jì),從2015年開(kāi)始,互聯(lián)網(wǎng)黑灰產(chǎn)業(yè)從業(yè)人員就已經(jīng)超過(guò)40萬(wàn)。
號(hào)稱(chēng)中國(guó)最大簡(jiǎn)歷大數(shù)據(jù)公司巧達(dá)科技被查
今年4月,北京警方破獲的巧達(dá)科技非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)案引發(fā)關(guān)注。這個(gè)號(hào)稱(chēng)中國(guó)最大的簡(jiǎn)歷大數(shù)據(jù)公司,專(zhuān)業(yè)提供招聘工具軟件和大數(shù)據(jù)分析服務(wù),擁有一系列的人力資源類(lèi)大數(shù)據(jù)產(chǎn)品,包括喬大招、妙招網(wǎng)及愛(ài)伙伴等,還曾獲得天使輪、A輪和B輪融資,資方包括李開(kāi)復(fù)的創(chuàng)新工場(chǎng)、中信產(chǎn)業(yè)基金等。
工商信息顯示,巧達(dá)科技成立于2014年7月,注冊(cè)資本為1050萬(wàn)元,其經(jīng)營(yíng)范圍包括技術(shù)開(kāi)發(fā)、技術(shù)服務(wù)、數(shù)據(jù)處理等。今年4月22日,北京市海淀區(qū)公安分局在官方微信公號(hào)上透露了巧達(dá)科技非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)一案的最新進(jìn)展。
據(jù)警方披露,2018年10月,某互聯(lián)網(wǎng)公司報(bào)案稱(chēng),其公司員工發(fā)現(xiàn)有人在互聯(lián)網(wǎng)上兜售疑似為該公司用戶(hù)信息的數(shù)據(jù)。經(jīng)初查,民警判斷該公司的用戶(hù)信息數(shù)據(jù)存在被人非法竊取的可能。通過(guò)對(duì)該公司服務(wù)器日志進(jìn)行調(diào)取、梳理、分析,初步還原了數(shù)據(jù)被竊取的全過(guò)程。
警方發(fā)現(xiàn),巧達(dá)科技公司在未經(jīng)授權(quán)的情況下,通過(guò)利用大量代理IP地址、偽造設(shè)備標(biāo)識(shí)等技術(shù)手段,繞過(guò)該公司服務(wù)器防護(hù)策略,大量惡意竊取存放在服務(wù)器上的用戶(hù)數(shù)據(jù)。且在竊取過(guò)程中,由于傳輸數(shù)據(jù)量過(guò)大,導(dǎo)致服務(wù)器數(shù)十次中斷服務(wù),影響上千萬(wàn)用戶(hù)正常訪(fǎng)問(wèn),給該公司帶來(lái)了嚴(yán)重的經(jīng)濟(jì)損失。
據(jù)新華社報(bào)道,這家企業(yè)非法爬取用戶(hù)數(shù)據(jù),數(shù)量之大、牟利之巨,令人咋舌。這些簡(jiǎn)歷信息等數(shù)據(jù)被用在教育培訓(xùn)、保險(xiǎn)、招聘等行業(yè),為巧達(dá)科技帶來(lái)了大量收入。公開(kāi)數(shù)據(jù)顯示,2017年,該公司全年收入4.11億元,凈利潤(rùn)1.86億元。巧達(dá)科技產(chǎn)品合伙人劉博也曾在采訪(fǎng)中稱(chēng)公司的商業(yè)模式為“獲取簡(jiǎn)歷、數(shù)據(jù)變現(xiàn)”。目前,巧達(dá)科技公司法人王某某等36人已被檢察機(jī)關(guān)依法批準(zhǔn)逮捕。
非法爬取數(shù)據(jù)存在法律風(fēng)險(xiǎn)
未經(jīng)平臺(tái)授權(quán)爬取數(shù)據(jù)信息可能構(gòu)成侵權(quán)、違法甚至犯罪行為
在對(duì)上述所謂“大數(shù)據(jù)”軟件提供信息采集服務(wù)的現(xiàn)象進(jìn)行調(diào)查中,南都記者注意到,有賣(mài)家在其業(yè)務(wù)介紹中自證清白稱(chēng)“違法亂紀(jì)的不做”,所提供的軟件外包和數(shù)據(jù)爬取等業(yè)務(wù)只爬取各種網(wǎng)頁(yè)、App公開(kāi)的“看得見(jiàn)”的數(shù)據(jù)。
那么,按照大數(shù)據(jù)采集商的觀點(diǎn),如果爬取的是網(wǎng)頁(yè)等公開(kāi)數(shù)據(jù),這種行為就真的合理合規(guī)?
事實(shí)上,非法獲取數(shù)據(jù)存在諸多法律風(fēng)險(xiǎn),雖然利用爬蟲(chóng)軟件等各種技術(shù)手段爬取互聯(lián)網(wǎng)數(shù)據(jù)的行為廣泛存在,但為保護(hù)自身數(shù)據(jù)不被爬取,很多企業(yè)也都設(shè)置了反爬蟲(chóng)策略。當(dāng)網(wǎng)絡(luò)爬蟲(chóng)非法抓取數(shù)據(jù)信息時(shí),可能構(gòu)成的侵權(quán)、違法甚至犯罪行為主要包括危害計(jì)算機(jī)信息系統(tǒng)安全類(lèi)、非法獲取公民個(gè)人信息類(lèi)和侵犯知識(shí)產(chǎn)權(quán)類(lèi)等。
近年來(lái),企業(yè)之間通過(guò)數(shù)據(jù)爬取引發(fā)的對(duì)于數(shù)據(jù)權(quán)益爭(zhēng)奪的各種案件層出不窮。比如,新浪訴脈脈抓取新浪微博用戶(hù)信息案、淘寶訴美景不正當(dāng)競(jìng)爭(zhēng)案等,對(duì)于非法爬取企業(yè)數(shù)據(jù)的行為,法律也更傾向于保護(hù)企業(yè)經(jīng)營(yíng)者的權(quán)利。
《網(wǎng)絡(luò)安全法》第27條規(guī)定,任何個(gè)人和組織不得從事“竊取網(wǎng)絡(luò)數(shù)據(jù)”等危害網(wǎng)絡(luò)安全的活動(dòng),不得提供專(zhuān)門(mén)用于從事侵入網(wǎng)絡(luò)、干擾網(wǎng)絡(luò)正常功能及防護(hù)措施、竊取網(wǎng)絡(luò)數(shù)據(jù)等危害網(wǎng)絡(luò)安全活動(dòng)的程序、工具。
上述紹興警方破獲的這起大規(guī)模數(shù)據(jù)竊取案件中,上市黑產(chǎn)公司在運(yùn)營(yíng)商服務(wù)器內(nèi)放置惡意程序清洗流量,導(dǎo)致30億條用戶(hù)數(shù)據(jù)被竊取。近日,公司法定代表人周某某等7人因涉嫌非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪,被檢察機(jī)關(guān)提起公訴。
針對(duì)裁判文書(shū)網(wǎng)數(shù)據(jù)被爬蟲(chóng)售賣(mài)一事,北京市社會(huì)組織法律調(diào)解中心副理事長(zhǎng)張新年律師認(rèn)為,裁判文書(shū)網(wǎng)站上的額內(nèi)容基于司法公開(kāi)目的,是免費(fèi)的公共資源,未經(jīng)最高人民法院授權(quán),商家售賣(mài)裁判文書(shū)網(wǎng)數(shù)據(jù)則會(huì)構(gòu)成侵權(quán)。