admin管理员组

文章数量:1130349

学习如何用无头浏览器模拟登陆

  • 1.关于使用什么无头浏览器
  • 2.安装chrome driver
  • 3.初步使用
    • 3.1调用并配置driver
    • 3.2尝试访问百度,并打印热搜第一位是啥
  • 4.实用一点的脚本-登陆IEEE投稿系统查询状态
    • 4.1 输入用户名+密码+点击登陆
    • 4.2 登陆后,需要跳转到author界面
    • 4.3 查看状态
  • 5.完整代码

1.关于使用什么无头浏览器

文章(点击查看)提到了PhantomJS暂停开发了。
然后他建议我们可以使用chrome或者火狐的无头浏览器。

替代方案

  • CSDN上的孔天逸从Mozilla上提供了Selenium+Headless Firefox在Python上实现的方法
  • 对于Chrome,博客园上的zhuxiaoxi提供了解决方案(需要安装chromedriver)

因为我的浏览器是chrome,所以我尝试第二种方案。
他还提供了示例代码,如下:

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
driver = webdriver.Chrome(chrome_options=chrome_options)
driver.get("https://cnblogs/")

所以要继续下去,需要安装chromedriver。

2.安装chrome driver

文章(点击查看) 提供了 selenium 安装与 chromedriver安装 的简单教程。

我的安装步骤:

  • 先在浏览器地址栏中输入chrome://version/查看了浏览器版本为:86.0.4240.111 (正式版本) (64 位)。
  • 然后在百度搜索到的chrome driver的mirror地址:http://npm.taobao/mirrors/chromedriver/中,找到自己对应的版本(见图1)
  • 然后解压后直接复制到chrome的文件夹中(据说随便一个文件夹也可以)(见图2)
  • 然后要在环境变量里面,把复制到的地址加进环境变量path里面:如地址:C:\Users\某某某\AppData\Local\Google\Chrome\Application\chromedriver_win32(见图3)
  • 然后在cmd里面输入chromedriver验证是否成功。有输出:ChromeDriver was started successfully.就OK了。

3.初步使用

3.1调用并配置driver

我装了这个之后,在jupyter里面用,说找不到环境变量。
只好代码手动配置了。

学习如何用无头浏览器模拟登陆

  • 1.关于使用什么无头浏览器
  • 2.安装chrome driver
  • 3.初步使用
    • 3.1调用并配置driver
    • 3.2尝试访问百度,并打印热搜第一位是啥
  • 4.实用一点的脚本-登陆IEEE投稿系统查询状态
    • 4.1 输入用户名+密码+点击登陆
    • 4.2 登陆后,需要跳转到author界面
    • 4.3 查看状态
  • 5.完整代码

1.关于使用什么无头浏览器

文章(点击查看)提到了PhantomJS暂停开发了。
然后他建议我们可以使用chrome或者火狐的无头浏览器。

替代方案

  • CSDN上的孔天逸从Mozilla上提供了Selenium+Headless Firefox在Python上实现的方法
  • 对于Chrome,博客园上的zhuxiaoxi提供了解决方案(需要安装chromedriver)

因为我的浏览器是chrome,所以我尝试第二种方案。
他还提供了示例代码,如下:

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
driver = webdriver.Chrome(chrome_options=chrome_options)
driver.get("https://cnblogs/")

所以要继续下去,需要安装chromedriver。

2.安装chrome driver

文章(点击查看) 提供了 selenium 安装与 chromedriver安装 的简单教程。

我的安装步骤:

  • 先在浏览器地址栏中输入chrome://version/查看了浏览器版本为:86.0.4240.111 (正式版本) (64 位)。
  • 然后在百度搜索到的chrome driver的mirror地址:http://npm.taobao/mirrors/chromedriver/中,找到自己对应的版本(见图1)
  • 然后解压后直接复制到chrome的文件夹中(据说随便一个文件夹也可以)(见图2)
  • 然后要在环境变量里面,把复制到的地址加进环境变量path里面:如地址:C:\Users\某某某\AppData\Local\Google\Chrome\Application\chromedriver_win32(见图3)
  • 然后在cmd里面输入chromedriver验证是否成功。有输出:ChromeDriver was started successfully.就OK了。

3.初步使用

3.1调用并配置driver

我装了这个之后,在jupyter里面用,说找不到环境变量。
只好代码手动配置了。

本文标签: 爬虫脚本无头浏览器状态