歡迎光臨
每天分享高質量文章

網路爬蟲的法律邊界:來看看你夠在裡面待幾年?

導讀:來交代一下,你抓了多少資料,在哪抓的,乾什麼用了,看夠在裡面待幾年。

從去年開始我看到好幾起因為抓取資料而遭遇訴訟,有的鋃鐺入獄,有的被處罰金,從案件的模糊描述來看,我看得後背發涼,似乎每個爬蟲選手都有被KO的風險。

這幾個月也停止了幾個抓取工作,把有關的法律和新聞認真看了幾遍,下麵跟大家一起分享。

作者:王平

來源:猿人學Python(ID:python-yrx)

這裡討論的是網路爬蟲技術本身,爬蟲技術的手法可以用來抓群資料,還可以做其它事情,比如登入社交賬號自動發帖,比如刷搜尋排名等等。

《刑法》對網路爬蟲的定罪依據:

《刑法》第 285 條,非法獲取計算機資訊系統資料罪。

獲取該計算機資訊系統中儲存、處理或者傳輸的資料,或者對該計算機資訊系統實施非法控制,

處三年以下有期徒刑或者拘役,並處或者單處罰金; 最高處七年有期徒刑並處罰金。

《刑法》第285條是對爬取資料的主要定罪依據,有興趣可以去查下中華人民共和國刑法。

定罪的幾個案例:

從已有案例來看有以下幾種情況:

1. 資料擁有者有證據能夠舉證你的資料是抓取來的

如下,今日頭條對起訴上海晟品法院宣判結果。

▲來自中國判決文書網

從文書描述來看,修改UA,修改device id,繞開網站訪問頻率控制這是寫爬蟲的基本,這些手法反而成為了獲罪的依據。

2. 抓取使用者社交資料,尤其是使用者隱私相關

▲來自新浪網

3. 用爬蟲技術擾亂對方網站經營規則,且牟利

比如這個:

▲來自中國永嘉公號

圖上描述做搜尋引擎排名的技術,其實就是利用爬蟲技術規模化的訪問網頁。

在我們通常的認知裡,因為網際網路推崇分享精神,所以認為只要是網路公開資料就可以抓取,但是透過上面的案例來看,有幾個禁忌,抓取的資料最好不要直接商用,涉及社交資訊/使用者資訊要謹慎。

老闆交代你抓取敏感任務時,讓老闆先看下刑法第285條。

這不代表個人行為就沒事,只是還沒入他們的法眼。

在資料抓取這方面,美國也有一個判決案例,美國一家小公司向法院起訴Linkedin,理由是Linkedin透過技術手段阻止他抓取Linkedin上的資料,而且法院判定這家公司勝訴,裁定Linkedin不準遮蔽這家公司的抓取行為。

目前我國法律是偏向資料擁有者的,如果資料擁有者有證據向法院起訴的話,抓取資料的一方多半會敗訴。

另外在抓取過程中,如果破解/反編譯對方客戶端、軟體,破解加密演演算法,比如你抓某APP資料,去反編譯他的客戶端,這絕對是犯法,這是破壞計算機資訊系統罪。

爬蟲有風險,開爬要謹慎。

關於作者:猿人學Python,一個IT老碼農,寫Python十年有餘,喜歡專研透過爬蟲技術來掙錢。

贊(0)

分享創造快樂