App下載
1. Scrapy框架介紹
Python Scrapy 網(wǎng)絡爬蟲入門課程 / 1. Scrapy框架介紹
手機也能上課
App下載
1/6

Scrapy框架認知

1

Scrapy 是一款由 Python 語言開發(fā)高效的爬蟲框架,使用 lxml(專業(yè)的 XML 處理包)、cssselect 高效地提取 HTML 頁面的有效信息,同時它也提供了有效的線程管理。 


可能你會有疑問,requests 和 urllib 同樣是爬蟲,為什么我們要使用 Scrapy 網(wǎng)絡請求框架?


因為 Scrapy 使用了 Twisted 異步網(wǎng)絡框架來處理網(wǎng)絡通訊。如此,開發(fā)者不用自己去實現(xiàn)異步框架,且下載速度可以更快。Scrapy 還包含了各種中間件接口,可以靈活的完成各種需求。


  在學習 Scrapy 框架之前,建議您對 python 語言、xpath 語法、正則表達式、html 狀態(tài)碼等網(wǎng)絡爬蟲知識有初步的了解。  


+10 經(jīng)驗 +10積分
解析
提示
參考答案
+10 經(jīng)驗 +10積分
視頻播放結(jié)束,是否學習下一節(jié)?