python爬取美女源码
2021/11/18 17:10:54
本文主要是介绍python爬取美女源码,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
可以直接使用 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 #需求:解析下载图片数据 http://pic.netbian.com/4kmeinv/ 4 import requests 5 from lxml import etree 6 import os 7 if __name__ == "__main__": 8 9 url = 'https://pic.netbian.com/4kmeinv/index_%d.html' 10 headers = { 11 'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36' 12 } 13 14 for n in range(1,150): 15 new_url = format(url%n) 16 print(new_url) 17 response = requests.get(url=new_url,headers=headers) 18 #手动设定响应数据的编码格式 19 # response.encoding = 'utf-8' 20 page_text = response.text 21 22 #数据解析:src的属性值 alt属性 23 tree = etree.HTML(page_text) 24 li_list = tree.xpath('//div[@class="slist"]/ul/li') 25 26 27 #创建一个文件夹 28 if not os.path.exists('./picLibs'): 29 os.mkdir('./picLibs') 30 31 for li in li_list: 32 img_src = 'http://pic.netbian.com'+li.xpath('./a/img/@src')[0] 33 img_name = li.xpath('./a/img/@alt')[0]+'.jpg' 34 #通用处理中文乱码的解决方案 35 img_name = img_name.encode('iso-8859-1').decode('gbk') 36 37 # print(img_name,img_src) 38 #请求图片进行持久化存储 39 img_data = requests.get(url=img_src,headers=headers).content 40 img_path = f'picLibs/{n}'+img_name 41 with open(img_path,'wb') as fp: 42 fp.write(img_data) 43 print(img_name,'下载成功!!!')
这篇关于python爬取美女源码的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-24Python编程基础详解
- 2024-11-21Python编程基础教程
- 2024-11-20Python编程基础与实践
- 2024-11-20Python编程基础与高级应用
- 2024-11-19Python 基础编程教程
- 2024-11-19Python基础入门教程
- 2024-11-17在FastAPI项目中添加一个生产级别的数据库——本地环境搭建指南
- 2024-11-16`PyMuPDF4LLM`:提取PDF数据的神器
- 2024-11-16四种数据科学Web界面框架快速对比:Rio、Reflex、Streamlit和Plotly Dash
- 2024-11-14获取参数学习:Python编程入门教程