admin管理员组

文章数量:1031225

Selenium自动爬取京东商品评论

文章目录

  • Selenium自动爬取京东商品评论
    • 第一步:导入工具包
    • 第二歩:启动假人,登录查看商品
    • 第三歩:找到商品评论
    • 第四步:爬取第一页源代码
    • 第五步:爬取多页评论
    • 第六步:提取评论内容

第一步:导入工具包

from selenium import webdriver
from selenium.webdriver.common.by import By 
import time
import os,re

os.getcwd() #查看当前工作路径
path='设定你的工作路径'
os.chdir(path)
if not os.path.exists("results"): #先判断,避免重复建立results文件夹
    os.makedirs("results") # 在当前路径下建立一个results文件夹,用于保存结果 

第二歩:启动假人,登录查看商品

启动浏览器,登录京东商城。这里我们手动登录,感兴趣的朋友可以尝试自动登录。

browser 

Selenium自动爬取京东商品评论

文章目录

  • Selenium自动爬取京东商品评论
    • 第一步:导入工具包
    • 第二歩:启动假人,登录查看商品
    • 第三歩:找到商品评论
    • 第四步:爬取第一页源代码
    • 第五步:爬取多页评论
    • 第六步:提取评论内容

第一步:导入工具包

from selenium import webdriver
from selenium.webdriver.common.by import By 
import time
import os,re

os.getcwd() #查看当前工作路径
path='设定你的工作路径'
os.chdir(path)
if not os.path.exists("results"): #先判断,避免重复建立results文件夹
    os.makedirs("results") # 在当前路径下建立一个results文件夹,用于保存结果 

第二歩:启动假人,登录查看商品

启动浏览器,登录京东商城。这里我们手动登录,感兴趣的朋友可以尝试自动登录。

browser 

本文标签: 京东商品selenium