歡迎光臨
每天分享高質量文章

程式員的一個爬蟲,把估值175億的馬蜂窩給捅了

程式猿(ID:imkuqin) 猿妹 整編

綜合自:小聲比比(ID:ziquanM)、財經網等

10月21日,一篇名為《估值175億的馬蜂窩,竟是一座僵屍和水軍構成的鬼城?》火了!直指旅游網站馬蜂窩大量內容和評論涉嫌造假。

事情是這樣的:

某資料團隊的幾個同學回國參加創業大賽,吃外賣拉了肚子,就在平臺寫了一段差評,結果反而被污衊詆毀。

碰巧這個團隊在美國學的都是資料分析,一怒之下決定訓練一個模型,用於篩選餐飲評論的水軍,恰巧馬蜂窩成了他們的練手物件,沒想到不爬則矣,一爬把馬蜂窩給捅了!

這篇文章中表示:“在馬蜂窩網站上,發現了7454個抄襲賬號,平均每個人從攜程、藝龍、美團、Agoda、Yelp上抄襲搬運了數千條點評,合計抄襲572萬條餐飲點評,1221萬條酒店點評,占到官網聲稱總點評數的85%。

文章中還列舉了幾項抄襲石錘:

還有的抄襲賬號自相矛盾,性別忽男忽女,甚至有些直接呼叫Google翻譯接口

馬蜂窩回應

22日早上,馬蜂窩也隨即發佈了宣告,表示會對涉嫌虛假的信息,進行查處。

另據最新訊息,針對自媒體報道的馬蜂窩資料造假一事,馬蜂窩已向北京市朝陽區人民法院提起訴訟,稱乎睿資料侵犯名譽權,目前已獲立案。

23日,馬蜂窩CEO陳罡也針對此事作出回應:馬蜂窩在餐飲等點評資料方面存在部分問題,但遠沒有外界所表述的那麼誇大。目前已經重新梳理工作流程,堵住漏洞。

網友怎麼說?

目前,這件事已經在各大論壇都議論紛紛:

這件事總算讓我見識到程式員的厲害之處了:

‘水軍’和‘爬蟲’一直都存在於互聯網行業,因為流量和資料對於一個互聯網企業不可或缺,關於資料糾紛問題在互聯網更是屢見不鮮,目前此事真相還未明瞭,我們暫時不予置評。

但通過這件事情告訴我們,惹誰也別惹程式員!尤其是有正義感又閑的技術宅。


●編號535,輸入編號直達本文

●輸入m獲取文章目錄

推薦↓↓↓

演算法與資料結構

更多推薦18個技術類公眾微信

涵蓋:程式人生、演算法與資料結構、黑客技術與網絡安全、大資料技術、前端開發、Java、Python、Web開發、安卓開發、iOS開發、C/C++、.NET、Linux、資料庫、運維等。

赞(0)

分享創造快樂