您当前的位置: 首页 >  爬虫

壹小俊

暂无认证

  • 1浏览

    0关注

    885博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

爬虫第二课---urllib

壹小俊 发布时间:2019-04-04 09:36:31 ,浏览量:1

import urllib.request

'''
普通请求,不设置headers
'''
# url = 'http://httpbin.org/get'#或post
# #urlopen    发起请求
# # req = urllib.request.urlopen(url)#get
# req = urllib.request.urlopen(url,data='username=huo'.encode(),timeout=2)#参数data就是post请求,timeout设置超时
# print(req.read().decode())

'''
设置headers
'''
urls = 'https://www.jianshu.com'
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36"
}
req = urllib.request.Request(urls,headers=headers)
r = urllib.request.urlopen(req)
print(r.read().decode())
​
import urllib.request
from http import cookiejar
#创建一个cookie对象
cookie = cookiejar.CookieJar()
filename = 'cookie.txt'
# cookie = cookiej
关注
打赏
1664335782
查看更多评论
立即登录/注册

微信扫码登录

0.0397s