用Python3爬虫抓取网页中的图片

中国互联网企业赴美上市规模预计今年或减半【滇企复工进行时】蓝队云：未雨绸缪，危机之下必有机遇用友云百城巡展（昆明站）：企业上云走向“敏轻简” 蓝队云荣获“考拉精选2018年度最佳网络服务商” 他们失败的辛酸血泪史：亿唐网、博客中国、酷6网、饭否

帮助中心 > 技术知识库 > 数据库 > 相关技术支持 > 用Python3爬虫抓取网页中的图片

用Python3爬虫抓取网页中的图片

2018-05-08 17:09:38 633

现在网上有很多python2写的爬虫抓取网页图片的实例，但不适用新手（新手都使用python3环境，不兼容python2），
所以我用Python3的语法写了一个简单抓取网页图片的实例，希望能够帮助到大家，并希望大家批评指正。
import urllib.request #这里需要注意python2中不用这个 直接用urllib
import re
import os
import urllib
#根据给定的网址来获取网页详细信息，得到的html就是网页的源代码  
def getHtml(url):
    page = urllib.request.urlopen(url)
    html = page.read()
    return html.decode('UTF-8')

def getImg(html):
    reg = r'src="(.+?\.jpg)" pic_ext'
    imgre = re.compile(reg)
    imglist = imgre.findall(html)#表示在整个网页中过滤出所有图片的地址，放在imglist中
    x = 0
    path = 'D:\\test'  
   # 将图片保存到D:\\test文件夹中，如果没有test文件夹则创建
    if not os.path.isdir(path):  
        os.makedirs(path)  
    paths = path+'\\'      #保存在test路径下  

    for imgurl in imglist:  
        urllib.request.urlretrieve(imgurl,'{}{}.jpg'.format(paths,x))  #打开imglist中保存的图片网址，并下载图片保存在本地，format格式化字符串 
        x = x + 1  
    return imglist
html = getHtml("http://www.landui.com/p/2460150866")#获取该网址网页详细信息，得到的html就是网页的源代码  
print (getImg(html)) #从网页源代码中分析并下载保存图片

上一篇：如何查看二进制文件的内容
下一篇：增加mysql最大连接数的修改方法

售前咨询

售前咨询服务时间：09:00-23:30

售前值班
4006-75-4006

咨询热线：

4006-75-4006（09:00-23:30）
0871-6388 6388 （总机）（工作日 09:00-18:00）

您可能遇到了下面的问题：
云服务器问题对象存储计费域名注册指南
售后咨询

售后咨询服务时间：00:00-24:00

24H值班技术
4006-75-4006

投诉与建议 最快响应10分钟

您可能遇到了下面的问题：
云服务器教程远程登陆问题 FTP上传问题其他问题查询
备案咨询

备案咨询服务时间：09:00-18:00（工作日）

备案专业客服
0871-6388 6388

您可能遇到了下面的问题：
备案所需材料提交备案流程关于幕布申请备案服务指引
电话

0871-6388 6388 （总机）
工单
二维码
TOP

相关文章

用Python3爬虫抓取网页中的图片

非常抱歉未能帮助到您。为了给您提供更好的服务，我们很需要您进一步的反馈信息：

在文档使用中是否遇到以下问题：

Copyright © 2012 - 2025 LanDui.com. All RightsReserved.　蓝队云版权所有

关于蓝队云

蓝队云产品

服务与支持

快速通道

售前咨询服务时间：09:00-23:30

咨询热线：

您可能遇到了下面的问题：

售后咨询服务时间：00:00-24:00

您可能遇到了下面的问题：

备案咨询服务时间：09:00-18:00（工作日）

您可能遇到了下面的问题：

相关文章

用Python3爬虫抓取网页中的图片

非常抱歉未能帮助到您。为了给您提供更好的服务，我们很需要您进一步的反馈信息：

在文档使用中是否遇到以下问题：

请选择找回账号返回>

Copyright © 2012 - 2025 LanDui.com. All RightsReserved. 蓝队云 版权所有

关于蓝队云

蓝队云产品

服务与支持

快速通道

售前咨询服务时间：09:00-23:30

咨询热线：

您可能遇到了下面的问题：

售后咨询服务时间：00:00-24:00

您可能遇到了下面的问题：

备案咨询服务时间：09:00-18:00（工作日）

您可能遇到了下面的问题：

Copyright © 2012 - 2025 LanDui.com. All RightsReserved.　蓝队云版权所有