這個用Python寫的開源爬蟲網站讓你秒搜所有豆瓣好書-知識星球

來自：程式員書庫（ID：OpenSourceTop）

程式員在提升自己的道路，大多還是會選擇閱讀程式設計書籍這一途徑，但找到一本好書就沒那麼容易了。

透過檢視各大銷售網站的銷量資料和評價，以及豆瓣評分和評價人數，可以幫助我們更快的挖掘出經典的計算機書籍，還有那些被人們忽視的好書。

最近猿哥在GitHub上發現了一個網站，是中國科學院自動化研究所的一大神（lanbing510）用Python寫的一個爬蟲，他在16年的時候就爬下了豆瓣所有的讀書資料並做了個WebApp介面方來挖掘查詢和閱讀好書。怪我知道的太晚

後來lanbing510再次爬了一遍豆瓣讀書的資料，總共更新了3232088本圖書資訊，共2138386KB，並將其開源

為什麼說它很好用呢？猿哥演示一遍你就知道了：

可以看出這網站的介面非常簡潔，沒有花裡花哨的內容，只有乾貨，你可以直接透過關鍵字、分數、和評價人數這三個選項進行搜尋，比如我們可以搜尋關鍵字：程式設計；分數：9.0；評價人數：100人以上

查詢結果的顯示方式有按照分數排序和人數排序兩種，按照分數排序的截圖如下：

按照評價人數排序的截圖如下：

除了以上演示的操作，這個網站並實現了以下功能：

也就是說你不僅可以在網站上搜索，還能透過下載各類目下的Excel書單檔案，直接在Excel中搜索

效果截圖如下：

最後附上網站地址：http://sobook.lanbing510.info

GitHub地址：https://github.com/lanbing510/DouBanSpider

這個用Python寫的開源爬蟲網站讓你秒搜所有豆瓣好書