Python爬取百度图片（支持关键词搜索）-369IT编程

admin管理员组
文章数量:1026989

import argparse         #用于命令项选项与参数解析
import os               #整理文件和目录
import re               #正则表达式  进行文字匹配
import sys              #argparse 将会从 sys.argv 中解析出这些参数，并自动生成帮助和使用信息。
import urllib
import json
import socket
import urllib.request   #制定url，获取网页数据
import urllib.parse     #将url解析为组件
import urllib.error     #可以捕获由 urllib.request 产生的异常。
import time             # 设置超时

timeout = 5
socket.setdefaulttimeout(timeout)  #防止爬虫爬取某个页面时间过长，导致程序卡置不前

class Crawler:
    __time_sleep = 0.1  # 睡眠时长
    __amount = 0
    __start_amount = 0
    __counter = 0
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0', 'Cookie': ''}
    #模拟浏览器头部信息，向服务器发送消息
    __per_page = 30

    # 获取图片url内容等
    # t 下载图片时间间隔
    def __init__(self, t=0.1):
        self.time_sleep = t

    @staticmethod
    def get_suffix(name):
        m = re.search(r'\.[^\.]*$', name)
        if m.group(0) and len(m.group(0)) <= 5:
            return m.group(0)
        else:
            return '.jpeg'
                                 # 获取后缀名
    @staticmethod
    def handle_baidu_cookie(original_cookie, cookies):
        """
        :param string original_cookie:
        :param list cookies:
        :return string:
        """
        if not cookies:
            return original_cookie
        result = original_cookie
        for cookie in cookies:

import argparse         #用于命令项选项与参数解析
import os               #整理文件和目录
import re               #正则表达式  进行文字匹配
import sys              #argparse 将会从 sys.argv 中解析出这些参数，并自动生成帮助和使用信息。
import urllib
import json
import socket
import urllib.request   #制定url，获取网页数据
import urllib.parse     #将url解析为组件
import urllib.error     #可以捕获由 urllib.request 产生的异常。
import time             # 设置超时

timeout = 5
socket.setdefaulttimeout(timeout)  #防止爬虫爬取某个页面时间过长，导致程序卡置不前

class Crawler:
    __time_sleep = 0.1  # 睡眠时长
    __amount = 0
    __start_amount = 0
    __counter = 0
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0', 'Cookie': ''}
    #模拟浏览器头部信息，向服务器发送消息
    __per_page = 30

    # 获取图片url内容等
    # t 下载图片时间间隔
    def __init__(self, t=0.1):
        self.time_sleep = t

    @staticmethod
    def get_suffix(name):
        m = re.search(r'\.[^\.]*$', name)
        if m.group(0) and len(m.group(0)) <= 5:
            return m.group(0)
        else:
            return '.jpeg'
                                 # 获取后缀名
    @staticmethod
    def handle_baidu_cookie(original_cookie, cookies):
        """
        :param string original_cookie:
        :param list cookies:
        :return string:
        """
        if not cookies:
            return original_cookie
        result = original_cookie
        for cookie in cookies:

本文标签：关键词图片 python

版权声明：本文标题：Python爬取百度图片（支持关键词搜索）内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://it.en369.cn/jiaocheng/1735051503a1291026.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

python文件运行闪退_python文件打开闪退怎么办

1月前

Python文件是以 .py 结尾的文件，可以用Python直接运行。不过在使用的过程中，可能遇到python文件无法打开，点击闪退的情况。那么python文件打开闪退怎么办

python编程用什么系统好_学Python用什么系统环境好？Linux还是Windows？

1月前

大家都知道系统分为Linux、Windows、Unix等多种，在学习Python的过程中，经常被提及的系统就是Linux和Windows这两个系统，很多人都会问学Python

Windows系统中的Python开发环境

1月前

在Windows系统中建立的Python开发环境包含两个部分，一个是Python解析器的安装，另一个是IDE的安装。 1.Python解析器的安装 Python解析器的最新版本是2017.3发

Windows下安装Python 模块的三种方法

1月前

方法一：cmd命令行窗口首先打开windows上的cmd命令行窗口，再将目录切换到python运行的那个目录下，那怎么查看自己是在那个目录下呢？ 鼠

Python远程获取Windows主机信息

1月前

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。以下文章来源于娜璋AI安全之家，作者 Eastmount 获取Windows主机信息 WMI(

Python, assigning operator names to K-means clusters - Stack Overflow

1月前

I have the following problem that is causing me a bit of a headache. I have a set of data, on this data

windows7上面安装opencv python开发环境，并处理cv2.VideoCapture()打不开视频文件的问题

1月前

安装步骤（opencv2.4.9为例）： 1.官方下载opencv-2.4.9.exe，然后双击解压到某个目录如:D:installopencv

Python生成个人CSDN历史博客文章列表及目录

1月前

Python生成个人CSDN历史博客文章列表及目录 2020年2020年04月2020年05月2020年06月2020年07月2020年08月2020年09月2020年10月2020年11月2020年12月 2021年2021年01月202

Win7windows8win 10系统下Photoshop不能直接拖拽打开图片的解决办法

1月前

我们知道Adobe Photoshop打开图片的方式有很多种，其中有一种是我们经常用到的，那就是直接从资源管理器或者其他地方中直接把图片通过拖拽的方式拖到PS窗口中打开，在W

Python中如何打开网页

1月前

幸好思念无声，可惜思念无声 ——24.6.4 Python打开前端网页 1.导入webbrowser库用webbrowser.open(传入网址)，打开网页 import webbrow

selenium+python-------- 打开chrome浏览器后闪退没有报错

1月前

版本匹配 1、selenium-3.141.0.dist-info 2、python-3_5_4 3、Google Chrome 版本 70.0.3538.67（正式版本） &#xff08

Python接管本地浏览器或者接管pyqt5搭建的浏览器，绕过WebDriver识别

1月前

Python接管本地浏览器或者接管pyqt5搭建的浏览器，绕过WebDriver识别首先打开chrome的目录，然后在命令行输入一下命令，为chrome开启一个端口 c

vue移动端工程在苹果ios系统上用浏览器打开不显示图片

1月前

从以下几个方面入手 1.在style中不要直接用标签名写样式 img{}2.用类名修改img样式时，height和width写100% .img-logo{height:100%;width:100%;}3.b

python用selenium打开浏览器后秒关闭浏览器-解决方法

26天前

学习selenium的时候，上手第一个脚本发现成功打开浏览器后，代码执行完毕浏览器又秒关闭了，代码如下： fromselenium import

python控制已经打开的浏览器_Python Webdriver 重新使用已经打开的浏览器实例

21天前

因为Webdriver每次实例化都会新开一个全新的浏览器会话，在有些情况下需要复用之前打开未关闭的会话。比如爬虫，希望结束脚本时，让浏览器处于空闲状态。当脚本重新运行时&am

【使用python打开指定的网址】

21天前

以下为是一些使用 Python 打开指定网址的代码示例： 使用 webbrowser 库的默认方式打开网址： import webbrowserurlhttps:www.exampl

Python+Selenium 不打开谷歌浏览器运行脚本

21天前

Python+Selenium 不打开谷歌浏览器运行脚本元素无法找到时，可能的一个原因是浏览器分辨率问题 chromeOptions是一个配置 chrome 启动是属性的类，可配置chrome参数： add_argument：启动参数ad

〖Python零基础入门篇③〗- Pycharm编辑器不能复制粘贴怎么办？

21天前

> 【易编橙·终身成长社群，相遇已是上上签！】- 点击跳转～ <哈哥撩编程 （视频号、抖音、B站同名）图书作者

我的python学习之路

20天前

更多内容请见： python3案例和总结-专栏介绍和目录文章目录 1. 入门阶段1.1 学习基础语法2. 进阶阶段2.1 数据结构2.2 文件操作2.3 异常处理3. 高级阶段3.1 面向对象编程（OOP）3.2 模块和包3.3 标准库4

在windows 64bit系统上安装python NLTK

20天前

由于最近需要做项目，需要进行分词等，查了资料之后，发现python NLTK很强大，于是就想试试看。在网上找了很多安装资料，都不太

369IT编程

Python爬取百度图片（支持关键词搜索）

更多相关文章

python文件运行闪退_python文件打开闪退怎么办

python编程用什么系统好_学Python用什么系统环境好？Linux还是Windows？

Windows系统中的Python开发环境

Windows下安装Python 模块的三种方法

Python远程获取Windows主机信息

Python, assigning operator names to K-means clusters - Stack Overflow

windows7上面安装opencv python开发环境，并处理cv2.VideoCapture()打不开视频文件的问题

Python生成个人CSDN历史博客文章列表及目录

Win7windows8win 10系统下Photoshop不能直接拖拽打开图片的解决办法

Python中如何打开网页

selenium+python-------- 打开chrome浏览器后闪退没有报错

Python接管本地浏览器或者接管pyqt5搭建的浏览器，绕过WebDriver识别

vue移动端工程在苹果ios系统上用浏览器打开不显示图片

python用selenium打开浏览器后秒关闭浏览器-解决方法

python控制已经打开的浏览器_Python Webdriver 重新使用已经打开的浏览器实例

【使用python打开指定的网址】

Python+Selenium 不打开谷歌浏览器运行脚本

〖Python零基础入门篇③〗- Pycharm编辑器不能复制粘贴怎么办？

我的python学习之路

在windows 64bit系统上安装python NLTK

发表评论

推荐文章

How to render nested tables in Jasper reports from JSON source? - Stack Overflow

javascript - Can&#39;t upload using PhantomJS - Stack Overflow

mysql - How to decide the maximal characters count for VARCHAR-like type columns in databases if specified value is actual only

html - how to delete a created table using javascript - Stack Overflow

php - WebSocket handshake not working - Stack Overflow

热门文章

plugins - Make specific products accessible only to a user role in WooCommerce

Insert Elements into XML code in the proper ordersequence? Python code - Stack Overflow

javascript - Cannot read properties of undefined (reading &#39;tagName&#39;) - Stack Overflow

php - Using Symfony with Backbone.js - Stack Overflow

javascript - R shinydashboard: specifying div style width argument as percentage to fit a resizeable JS plot - Stack Overflow

javascript - How to toggle an animation in Jquery - Stack Overflow

Pine Script: I want to plot bomax value on data window - Stack Overflow

Mapping custom root domain to Windows Azure CDN does not work - Stack Overflow

nuxt3.js - Nuxt3 config to fetch the data from rest api and generate static page based on fetched data - Stack Overflow

c# - How to access test class state from custom IApplyToTest-attribute? - Stack Overflow

最新文章

windows设置断电重启开机后自动输入锁屏密码登录

Windows系统设置开机默认开启数字小键盘

Windows11 开机自动同步时间（开机时间不更新问题）

windows配置开机自启动软件或脚本

【Redis】Windows设置Redis为开机自启动

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

javascript - Type &#39;undefined&#39; is not assignable to type &#39;menuItemProps[]&#39; - Stack Overflow

javascript - VS 2015 Angular 2 import modules cannot be resolved - Stack Overflow

javascript - Get the JSON objects that are not present in another array - Stack Overflow

javascript - How to dismiss a phonegap notification programmatically - Stack Overflow

c - Solaris 10 make Error code 1 Fatal Error when trying to build python 2.7.16 - Stack Overflow

javascript - Can't upload using PhantomJS - Stack Overflow

javascript - Cannot read properties of undefined (reading 'tagName') - Stack Overflow

javascript - Type 'undefined' is not assignable to type 'menuItemProps[]' - Stack Overflow