Python简单代码爬取网图:正则表达式re+requests库爬取静态网站图片,(需要正则表达式findall匹配图片地址)
2021/10/29 20:11:03
本文主要是介绍Python简单代码爬取网图:正则表达式re+requests库爬取静态网站图片,(需要正则表达式findall匹配图片地址),对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
一、前言
网图实在太多了,好康的网图也实在是太多了,有时候恨不得10只手一起保存图片,以便留下宝贵记忆。但是python的出现让我告别了烦恼,学习了python的正则表达式以及requests库,我们通过简单的代码就可以批量爬取图片。
二、实例与代码
1.示例
2.代码
import re#引入正则表达式 import requests#request库用于获取网络源代码 import os#os库用于存储 resp = requests.get('http://www.keaitupian.cn/meinv/')# 拿到网页的响应 resp.encoding = resp.apparent_encoding#转一下码,不然出现中文容易乱码 ls=re.findall(r'http://img.keaitupian.cn/(?:newupload|uploads).*.jpg',resp.text)#用正则表达式匹配图片地址并存到ls列表中 n=0 #n用于计数,并将命名文件 os.mkdir('D:/pic')#创建pic目录 for i in ls: r=requests.get(i) with open('D:/pic/'+str(n)+'.jpg', 'wb') as f: #将每一个图片地址以二进制方法存入计算机中 f.write(r.content) f.close() n=n+1
三、总结
正则表达式中findall用“(|)” 的话一定要在里面加?: 一定要在里面加?: 一定要在里面加?: ! 否则findall只会匹配到括号内的字符,这是本次爬虫最最最最最大的收获了
这些东西有些re和requests的基础,在座的各位只要看几遍 应该就都懂了,没有看懂的也问题不大,可能是我写得过于潦草造成的。总之,正则表达式 yyds,非常建议学习正则表达式~有建议尽管留言~
这篇关于Python简单代码爬取网图:正则表达式re+requests库爬取静态网站图片,(需要正则表达式findall匹配图片地址)的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-24Python编程基础详解
- 2024-11-21Python编程基础教程
- 2024-11-20Python编程基础与实践
- 2024-11-20Python编程基础与高级应用
- 2024-11-19Python 基础编程教程
- 2024-11-19Python基础入门教程
- 2024-11-17在FastAPI项目中添加一个生产级别的数据库——本地环境搭建指南
- 2024-11-16`PyMuPDF4LLM`:提取PDF数据的神器
- 2024-11-16四种数据科学Web界面框架快速对比:Rio、Reflex、Streamlit和Plotly Dash
- 2024-11-14获取参数学习:Python编程入门教程