准备工作
安装好selenium和浏览器驱动chromedriver。
淘宝爬虫过程分析加代码
1.页面请求分析
首先请求淘宝页面,然后输入要爬取的数据的关键词,没有登陆,此时会弹出登陆的窗口,采取模拟浏览器登陆形式进行登陆,之后获取页面的文本信息。
安装好浏览器驱动chromedriver,可以先配置其地址信息,实现代码如下:
chrome_driver = r"F:\python\python_environment\chromedriver.exe"
browser = webdriver