python爬蟲開發之urllib模塊詳細使用方法與實例全解-創新互聯

爬蟲所需要的功能，基本上在urllib中都能找到，學習這個標準庫，可以更加深入的理解后面更加便利的requests庫。

創新互聯公司是一家專業提供瑞昌企業網站建設,專注與成都網站設計、成都做網站、外貿網站建設、H5建站、小程序制作等業務。10年已為瑞昌眾多企業、政府機構等服務。創新互聯專業網站制作公司優惠進行中。

首先

在Pytho2.x中使用import urllib2——-對應的，在Python3.x中會使用import urllib.request，urllib.error

在Pytho2.x中使用import urllib——-對應的，在Python3.x中會使用import urllib.request，urllib.error，urllib.parse

在Pytho2.x中使用import urlparse——-對應的，在Python3.x中會使用import urllib.parse

在Pytho2.x中使用import urlopen——-對應的，在Python3.x中會使用import urllib.request.urlopen

在Pytho2.x中使用import urlencode——-對應的，在Python3.x中會使用import urllib.parse.urlencode

在Pytho2.x中使用import urllib.quote——-對應的，在Python3.x中會使用import urllib.request.quote

在Pytho2.x中使用cookielib.CookieJar——-對應的，在Python3.x中會使用http.CookieJar

在Pytho2.x中使用urllib2.Request——-對應的，在Python3.x中會使用urllib.request.Request

urllib是Python自帶的標準庫，無需安裝，直接可以用。

urllib模塊提供了如下功能：

網頁請求(urllib.request)
URL解析(urllib.parse)
代理和cookie設置
異常處理(urllib.error)
robots.txt解析模塊(urllib.robotparser)

urllib包中urllib.request模塊

1、urllib.request.urlopen

urlopen一般常用的有三個參數，它的參數如下：

r = urllib.requeset.urlopen(url,data,timeout)

url：鏈接格式：協議://主機名:[端口]/路徑

data：附加參數必須是字節流編碼格式的內容(bytes類型)，可通過bytes()函數轉化，如果要傳遞這個參數，請求方式就不再是GET方式請求，而是POST方式

timeout: 超時單位為秒

get請求

import urllib
r = urllib.urlopen('//www.jb51.net/')
datatLine = r.readline() #讀取html頁面的第一行
data=file.read() #讀取全部
f=open("./1.html","wb") # 網頁保存在本地
f.write(data)
f.close()

另外有需要云服務器可以了解下創新互聯scvps.cn，海內外云服務器15元起步，三天無理由+7*72小時售后在線，公司持有idc許可證，提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業上云的綜合解決方案，具有“安全穩定、簡單易用、服務可用性高、性價比高”等特點與優勢，專為企業上云打造定制，能夠滿足用戶豐富、多元化的應用場景需求。

當前名稱：python爬蟲開發之urllib模塊詳細使用方法與實例全解-創新互聯
鏈接URL：http://m.jcarcd.cn/article/ccijgs.html

精品专区-精品自拍9-精品自拍三级乱伦-精品自拍视频-精品自拍视频曝光-精品自拍小视频

NEWS

網站建設資訊

python爬蟲開發之urllib模塊詳細使用方法與實例全解-創新互聯

urllib包中urllib.request模塊

1、urllib.request.urlopen

get請求

其他資訊

精品专区-精品自拍9-精品自拍三级乱伦-精品自拍视频-精品自拍视频曝光-精品自拍小视频

NEWS

網站建設資訊

python爬蟲開發之urllib模塊詳細使用方法與實例全解-創新互聯

urllib包中urllib.request模塊

1、urllib.request.urlopen

get請求

其他資訊

1、urllib.request.urlopen