selenium提取数据之driver对象的常用属性和方法
在使用selenium过程中,实例化driver对象后,driver对象有一些常用的属性和方法
driver.page_source
当前标签页浏览器渲染之后的网页源代码 (包括表头等的源代码)driver.current_url
当前标签页的urldriver.close()
关闭当前标签页,如果只有一个标签页则关闭整个浏览器driver.quit()
关闭浏览器driver.forward()
页面前进driver.back()
页面后退driver.screen_shot(img_name)
页面截图 (此处不同版本方法名可能是不一样的)
示例代码如下:
from selenium import webdriver
import time
url = 'http://www.baidu.com'
# 创建一个浏览器对象
driver = webdriver.Chrome()
# 访问指定的url地址
driver.get(url)
# 显示源码
# print(driver.page_source)
# print(driver.current_url) # 此行代码输出结果:https://www.baidu.com/ 由http变成了https
# print(driver.title) # 百度一下,你就知道
# time.sleep(2)
# driver.get('http://douban.com')
#
# time.sleep(2)
# driver.back()
#
# time.sleep(2)
# driver.forward()
#
# time.sleep(2)
# driver.close() # 一般情况下forward()和back()用的很少,访问地址直接用get就好了
# 保存网页快照, 常用于验证是否运行或者验证码截图
driver.save_screenshot('baidu.png') # 将页面截图
driver.quit()