10/11 真 网络爬虫基本教学(解析,读取文字,案例)
2021/10/12 6:17:27
本文主要是介绍10/11 真 网络爬虫基本教学(解析,读取文字,案例),对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
0.安装调用bs(BeautifulSoup
)模块
输入pip install BeautifulSoup4
(Mac电脑需要输入pip3 install BeautifulSoup4)
bs模块相当与一种网络解析器,可以把网络文件翻译成可编辑的模式
1.首先确认网络的反馈,检查相应是否成功
# 调用requests库 import requests # 获取网页源代码,得到的res是response对象 res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html') # 检查请求是否正确响应 print(res.status_code)
响应码 | 说明 | 举例 | 表示 |
1xx | 请求收到 | 100 | 继续 |
2xx | 请求成功 | 200 | 成功 |
2xx | 重定向 | 305 | 代理访问(科学上网) |
2xx | 客户端错误 | 404 | 找不到网页 |
2xx | 服务器错误 | 503 | 服务器崩了 |
这篇关于10/11 真 网络爬虫基本教学(解析,读取文字,案例)的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-10-06小米11i印度快充版ROM合集:极致体验,超越期待
- 2024-10-06【ROM下载】小米11i 5G 印度版系统, 疾速跃迁,定义新速度
- 2024-10-06【ROM下载】小米 11 青春活力版,青春无极限,活力全开
- 2024-10-05小米13T Pro系统合集:性能与摄影的极致融合,值得你升级的系统ROM
- 2024-10-01基于Python+Vue开发的医院门诊预约挂号系统
- 2024-10-01基于Python+Vue开发的旅游景区管理系统
- 2024-10-01RestfulAPI入门指南:打造简单易懂的API接口
- 2024-10-01初学者指南:了解和使用Server Action
- 2024-10-01Server Component入门指南:搭建与配置详解
- 2024-10-01React 中使用 useRequest 实现数据请求