歡迎光臨
每天分享高質量文章

學習Python,除了小姐姐,還有小哥哥

 

聽說咱們這裡有很多小姐姐,既然這樣,那麼咱們就來一波肌肉男、美男,你們都有小編了,還想著其他的,唉~
宣告:小編不是彎的

 預備知識 


 爬取《帥啊》網的帥哥圖片!

    URL : http://www.shuaia.net/index.html   先看一眼網站的樣子:

 

requests安裝

在cmd中,使用如下指令安裝第三方庫requests:

pip3 install requests

或者:

easy_install requests

爬取單頁標的連結

透過審查元素,我們不難發現,標的的地址儲存在class屬性為”item-img”的標簽的href屬性中。這時候,有人可能會問為啥不用下麵的標簽的src屬性?因為這個圖片是首頁的瀏覽圖片,根據這個地址儲存下來的圖片,太小了,並且不清清楚。秉承著熱愛“高畫質無碼”的精神,這種圖片可不是我想要的。因此,先獲取標的的地址,也就是我們點選圖片之後,進入的網頁地址,然後根據下一個網頁,找到圖片的地址。

程式碼 

我們將爬取的資訊儲存到list中,圖片名字和圖片地址使用”=”連線,執行結果:

爬取多頁連結 

翻到第二頁的時候,很容易就發現地址變了:www.shuaia.net/index_2.html。第三頁、第四頁、第五頁依此類推。

程式碼+執行結果 

 單張圖片下載 

進入標的地址,審查元素。可以看到,圖片地址儲存在了class屬性為
”wr-single-content-list “的div->div->img的src屬性中。

 程式碼 

 我們將圖片儲存在程式檔案所在目錄的imgase目錄下:

整體程式碼 

已經獲取到了每張圖片的連線,我們就可以下載了。整合下程式碼,先少下載一點,下載前2頁的圖片。

 執行結果

作者:Jack-Cui

源自:http://blog.csdn.net/c406495762/article/details/72597755

宣告:文章著作權歸作者所有,如有侵權,請聯絡小編刪除

贊(0)

分享創造快樂