首頁(yè)>要聞>沸點(diǎn) 沸點(diǎn)

裁判文書網(wǎng)數(shù)據(jù)竟被商家標(biāo)價(jià)售賣 律師:或構(gòu)成侵權(quán)

2019年08月02日 07:47 | 來(lái)源:北京青年報(bào)
分享到: 

裁判文書網(wǎng)數(shù)據(jù)竟被商家標(biāo)價(jià)售賣

商家:利用“網(wǎng)絡(luò)爬蟲”技術(shù)獲取大量數(shù)據(jù) 律師:未經(jīng)法院授權(quán)此行為構(gòu)成侵權(quán)

點(diǎn)擊進(jìn)入下一頁(yè)

販賣數(shù)據(jù)商家的推銷頁(yè)面

昨天,北京青年報(bào)從某網(wǎng)購(gòu)商城看到,最高人民法院裁判文書網(wǎng)的數(shù)據(jù)被標(biāo)價(jià)0.1元到1元不等出售。裁判文書網(wǎng)發(fā)布的判決書都是公開(kāi)的,為什么會(huì)被售賣?獲取裁判文書網(wǎng)數(shù)據(jù)的手段對(duì)于網(wǎng)站是否有危害呢?

網(wǎng)售數(shù)據(jù)

價(jià)格需“私聊”獲取

北青報(bào)記者在某網(wǎng)絡(luò)商城中看到,有標(biāo)注來(lái)自湖南、廣東、山東等多地的商家均聲稱出售裁判文書網(wǎng)的數(shù)據(jù),其中不少商家聲稱其數(shù)據(jù)量超6000萬(wàn)條。而據(jù)裁判文書網(wǎng)公開(kāi)數(shù)據(jù)顯示,目前裁判文書網(wǎng)上公開(kāi)的文書總量為7395萬(wàn)多篇,如果商家所稱的數(shù)量屬實(shí),則商家能夠提供絕大多數(shù)已經(jīng)公開(kāi)的文書數(shù)據(jù)。

不少聲稱能夠出售裁判文書網(wǎng)數(shù)據(jù)的商家在商品文字描述中稱,其數(shù)據(jù)是通過(guò)“網(wǎng)絡(luò)爬蟲”的方式獲取的。所謂“網(wǎng)絡(luò)爬蟲”,又稱網(wǎng)頁(yè)蜘蛛、網(wǎng)頁(yè)機(jī)器人,是一種按照一定的規(guī)則,自動(dòng)地抓取萬(wàn)維網(wǎng)信息的程序或者腳本。相當(dāng)于一個(gè)自動(dòng)訪問(wèn)網(wǎng)頁(yè)并進(jìn)行相關(guān)操作的小機(jī)器人。

北青報(bào)記者注意到,盡管每名商家均在商品頁(yè)面標(biāo)示稱,其數(shù)據(jù)售價(jià)為0.1元至1元,但每名商家均在文字描述中表示,數(shù)據(jù)的售價(jià)并不以標(biāo)示為準(zhǔn),而是需要“私聊”獲取。

一名售賣裁判文書數(shù)據(jù)的商家說(shuō),購(gòu)買裁判文書數(shù)據(jù)的買家所需要的數(shù)據(jù)量從幾千篇到幾千萬(wàn)篇不等,有的買家是因?yàn)闊o(wú)法打開(kāi)裁判文書網(wǎng)而不得不來(lái)求助于數(shù)據(jù)賣家,“還有很多學(xué)生買數(shù)據(jù)用于論文寫作,這種情況幾千條就夠了,商用的話可能需要幾百萬(wàn)條甚至上千萬(wàn)條?!鄙碳疫€稱,每個(gè)月他們能接到四五個(gè)文書數(shù)據(jù)采集的訂單,而價(jià)格和買家需要的數(shù)據(jù)量有關(guān),“幾百萬(wàn)條數(shù)據(jù)大概要幾千塊錢,現(xiàn)在加密技術(shù)很嚴(yán)格,所以要貴一些?!?/p>

“爬蟲”系統(tǒng)

曾致正常用戶無(wú)法訪問(wèn)

北青報(bào)記者了解到,部分技術(shù)機(jī)構(gòu)通過(guò)網(wǎng)絡(luò)爬蟲系統(tǒng)獲取裁判文書網(wǎng)數(shù)據(jù)的行為,已經(jīng)給裁判文書網(wǎng)正常用戶的訪問(wèn)帶來(lái)了不便。不少網(wǎng)友曾在網(wǎng)上發(fā)帖稱,自己搜索裁判文書時(shí),常常遭遇裁判文書網(wǎng)網(wǎng)站顯示因?yàn)橄到y(tǒng)原因,無(wú)法查詢的情況。

對(duì)此,最高人民法院在其官網(wǎng)回應(yīng)網(wǎng)友對(duì)于裁判文書網(wǎng)運(yùn)行慢、故障頻繁等情況時(shí)表示,由于中國(guó)裁判文書網(wǎng)公開(kāi)文書數(shù)量和影響力不斷增加,訪問(wèn)用戶數(shù)不斷增長(zhǎng)。同時(shí),2018年5月初以來(lái),大量技術(shù)公司通過(guò)爬蟲系統(tǒng)無(wú)限制并發(fā)訪問(wèn)非法獲取裁判文書數(shù)據(jù),造成網(wǎng)站負(fù)荷過(guò)大,大量正常用戶請(qǐng)求堵塞,訪問(wèn)出現(xiàn)速度慢或部分頁(yè)面無(wú)法顯示等現(xiàn)象。

今年5月,最高人民法院信息中心主任許建峰在接受媒體采訪時(shí)表示:“中國(guó)裁判文書網(wǎng)目前每天的訪問(wèn)量可以達(dá)到幾千萬(wàn)的量級(jí),其中還包括數(shù)據(jù)爬蟲的攻擊,我們的中心服務(wù)器承受著巨大壓力。”

“我們每時(shí)每刻都在監(jiān)控著它的應(yīng)用情況,希望遇到問(wèn)題立即采取措施,但是的確還不能完全跟得上步子,所以會(huì)出現(xiàn)停網(wǎng)維護(hù)運(yùn)營(yíng)的情況?!痹S建峰說(shuō),最高法已成立了專門的運(yùn)維保障團(tuán)隊(duì)去維護(hù)管理中國(guó)裁判文書網(wǎng),也將在技術(shù)與人力上投入更多的力量。

相關(guān)機(jī)構(gòu)

已采用多種方式“反爬”

北青報(bào)記者獲悉,此前,相關(guān)方面已采取多種方式,對(duì)抗“爬蟲技術(shù)”。最高人民法院曾發(fā)文稱,為更好地確保正常用戶訪問(wèn)性能,相關(guān)方面以驗(yàn)證碼的方式上線系統(tǒng)軟件防爬功能?!膀?yàn)證碼技術(shù)是防爬蟲的一種有效措施,當(dāng)瀏覽量在某段時(shí)間內(nèi)達(dá)到一定數(shù)量后,將啟用驗(yàn)證碼機(jī)制進(jìn)行核驗(yàn)。后續(xù),我們將不定期更新防爬蟲技術(shù),加強(qiáng)網(wǎng)站維護(hù),提高網(wǎng)站運(yùn)行效率和穩(wěn)定性?!?/p>

此外,針對(duì)網(wǎng)友提問(wèn),為何不能按照“公開(kāi)時(shí)間”為檢索條件進(jìn)行裁判文書檢索時(shí),最高人民法院方面表示,暫沒(méi)有設(shè)置“公開(kāi)時(shí)間”為檢索條件的主要原因是爬蟲系統(tǒng)會(huì)根據(jù)“公開(kāi)時(shí)間”項(xiàng)進(jìn)行增量文書爬取,“待下一步防爬蟲系統(tǒng)穩(wěn)定、可靠運(yùn)行一段時(shí)間后,我們將適時(shí)考慮增加‘公開(kāi)時(shí)間’檢索項(xiàng)。”

此外,最高人民法院方面稱:“由于前期爬蟲行為過(guò)于猖獗,無(wú)限制暴力訪問(wèn)大幅降低正常用戶訪問(wèn)性能,我們采取了通過(guò)限制列表頁(yè)面翻頁(yè)數(shù)量來(lái)防止爬蟲系統(tǒng)的措施?!?/p>

文/本報(bào)記者 屈暢

實(shí)習(xí)生 趙詣涵 統(tǒng)籌/池海波

律師分析

強(qiáng)行突破“反爬”技術(shù)或構(gòu)成犯罪

金杜律師事務(wù)所從事IP類法律業(yè)務(wù)的律師瞿淼曾發(fā)文闡述了網(wǎng)絡(luò)爬蟲所涉及的法律問(wèn)題。瞿淼稱,從技術(shù)中立的角度而言,爬蟲技術(shù)本身并無(wú)違法違規(guī)之處。但是,隨著數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,數(shù)據(jù)爬取帶來(lái)的各種問(wèn)題和顧慮日漸增加。過(guò)于野蠻的爬蟲可能造成網(wǎng)站負(fù)荷過(guò)大,從而導(dǎo)致網(wǎng)站癱瘓、不能訪問(wèn)等。

“由于爬蟲的批量訪問(wèn)會(huì)給網(wǎng)站帶來(lái)巨大的壓力和負(fù)擔(dān),因此許多網(wǎng)站經(jīng)營(yíng)者會(huì)采取技術(shù)手段,以阻止爬蟲批量獲取自己網(wǎng)站信息。而針對(duì)這些技術(shù)手段,爬蟲開(kāi)發(fā)者可以通過(guò)優(yōu)化自己的代碼、使用IP池等多種方式規(guī)避上述技術(shù)措施,實(shí)現(xiàn)對(duì)網(wǎng)站信息的批量抓取和復(fù)制?!宾捻嫡f(shuō),由于網(wǎng)絡(luò)爬蟲會(huì)根據(jù)特定策略盡可能多地訪問(wèn)頁(yè)面,因而爬蟲的使用將占用被訪問(wèn)網(wǎng)站的網(wǎng)絡(luò)帶寬并增加網(wǎng)絡(luò)服務(wù)器的處理開(kāi)銷,甚至無(wú)法正常提供服務(wù)。

瞿淼認(rèn)為,根據(jù)《反不正當(dāng)競(jìng)爭(zhēng)法》關(guān)于網(wǎng)絡(luò)的相關(guān)條款,如果網(wǎng)站運(yùn)營(yíng)者已經(jīng)采取了一定的反爬蟲措施,而爬蟲控制者基于經(jīng)營(yíng)目的、強(qiáng)行突破網(wǎng)站運(yùn)營(yíng)者采取的反爬蟲技術(shù)措施,并客觀導(dǎo)致被抓取網(wǎng)站無(wú)法正常運(yùn)行,則可能構(gòu)成不正當(dāng)競(jìng)爭(zhēng)行為。此外,強(qiáng)行突破某些特定被爬方的技術(shù)措施,還可能構(gòu)成刑事犯罪行為。

針對(duì)此情況,北京市社會(huì)組織法律調(diào)解中心副理事長(zhǎng)張新年律師認(rèn)為,“這些裁判文書基于司法公開(kāi)目的,是免費(fèi)的公共資源,未經(jīng)最高人民法院授權(quán),商家售賣裁判文書網(wǎng)數(shù)據(jù)構(gòu)成侵權(quán)?!?/p>

文/本報(bào)記者 屈暢 朱健勇

編輯:周佳佳

關(guān)鍵詞:文書 數(shù)據(jù) 裁判 爬蟲

更多

更多