目的:输入要爬取的职位名称,五个意向城市,爬取智联招聘上的该信息,并打印进表格中
####基本环境配置:
- Python版本:2.7
- 开发工具:pycharm
- 系统:win10 ####相关模块:
import urllib2
import re
import xlwt
####完整代码:
import urllib2
import re
import xlwt
'''
遇到不懂的问题?Python学习交流群:821460695满足你的需求,资料都已经上传群文件,可以自行下载!
'''
class ZLZP(object):
def __init__(self,workname,citys):
# 记录查找工作名称
self.workname = workname
# 基础URL地址
self.url = 'http://sou.zhaopin.com/jobs/searchresult.ashx?'
# 工作名称
args = 'kw=%s&jl='%workname
# 工作地点
for city in citys:
# 判断城市是否为最后一个
if city == citys[-1]:
args += city
else:
args += city
args += '%2B'
# kw=python&jl=北京%2B上海%2B南京%2B广州%2B深圳
# 拼接完整的url地址
self.url += args
self.headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:54.0) Gecko/20100101 Firefox/54.0'
}
# 根据页码获取某一页HTML源代码
def get_page(self,pageNum):
# 1.根据页码拼接完整的url地址
getUrl = self.url + '&p=%s'%pageNum
# 2.创建request对象
request = urllib2.Request(getUrl,headers=self.headers)
try:
response = urllib2.urlopen(request)
except Exception ,e:
print '获取第%s页数据失败,原因%s'%(pageNum,e)
return None
else:
return response.read()
# 从html代码中提取总职位数
def get_total(self,html):
# 1.准备正则表达式
pattern = re.compile(r'
关注
打赏
热门博文
- Python骚操作,实现驾考自动答题,这就直接满分了?
- 用Python自动实现图表可视化操作,提高工作效率,又能有更多的时间摸鱼了~
- Python:用tkinter制做一个音乐下载小软件
- Python丨小学妹喜欢看漫画,于是我写了四十行代码获取了它所有漫画
- 女同桌找我要表情包,还好我会Python,分分钟给她下载几十个G...
- 为了防止这上面的文章被封,我连夜用Python获取了它所有内容,真香~
- 这个Python读取文件的方法,堪称天花板级别...
- Python做一个通过输入bv号就能下载视频的工具,评论和弹幕也不放过
- Python爬虫何如抓包?这三个案例手把手教会你,非常详细...
- Python:50行代码实现下载小说,图片章节可自动识别转文字保存...