1/6Python网络爬虫:Selenium--以携程酒店为例1Selenium简介Selenium是一个用于网站应用程序自动化的工具,它可以直接运行在浏览器中,就像真正的用户在操作一样
它相当于一个机器人,可以模拟人类在浏览器上的一些行为,比如输入文本、点击、回车等
Selenium支持多种浏览器,本文以Chrome浏览器为例
chromedriver是一个驱动Chrome浏览器的驱动程序,针对不同的浏览器有不同的driver
1Selenium的优缺点优点:浏览器能请求到的数据,Selenium同样能请求到,爬虫稳定,适用于所有类型的动态渲染网页
缺点:代码量大、容易被反爬、性能低
笔者认为性能低、速度慢是其最大缺点
2浏览器基本操作浏览器基本操作包括打开浏览器、设置窗口大小、设置打开浏览器位置、关闭浏览器、前进、后退、刷新、获取网页代码等
下面先通过代码来演示如何打开网页并设置浏览器窗口的大小以及打开位置:1fromseleniumimportwebdriver2fromselenium
webdriver
chrome
serviceimportService3fromselenium
webdriver
chrome
optionsimportOptions45url='https://hotels
com/hotels/396376
html#ctm_ref=hp_htl_pt_pro_01'#携程上海虹桥宾馆主页6service=Service(executable_path=r'D:\anaconda\Scripts\chromedriver
exe')#指定chromedriver位置7opt=Options()8opt
add_argument(9'user-agent="Mozilla/