《python网络爬虫入门实践》笔记:chp3 静态网页抓取(上)
2021/11/23 22:12:18
本文主要是介绍《python网络爬虫入门实践》笔记:chp3 静态网页抓取(上),对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
获取响应内容
import requests r = requests.get("http://www.baidu.com") print("文笔编码", r.encoding) print("响应状态码", r.status_code) print("字符串方式的响应体", r.text)
定制Requests
传递url参数
import requests keydict = {'key1': 'value1', 'key2': 'value2'} r = requests.get("http://httpbin.org/get", params=keydict) print("url已经正确编码", r.url) print("字符串方式的响应体:\n", r.text)
定制请求头
import requests headers = { 'Host': 'httpbin.org', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ' 'Chrome/96.0.4664.45 Safari/537.36 Edg/96.0.1054.29'} r = requests.get("http://httpbin.org", headers=headers) print(r.status_code)
发送POST请求
import requests keydict = {'key1': 'value1', 'key2': 'value2'} r = requests.post("http://httpbin.org/post", data=keydict) print("url已经正确编码", r.url) print("字符串方式的响应体:\n", r.text)
超时
import requests link = "http://www.httpbin.org" r = requests.get(link, timeout=0.0001) print("文笔编码", r.encoding) print("响应状态码", r.status_code) print("字符串方式的响应体", r.text)
这篇关于《python网络爬虫入门实践》笔记:chp3 静态网页抓取(上)的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-09-27使用python 将ETH账户的资产打散
- 2024-09-26Python编程基础
- 2024-09-2610 种方法写出更好的 Python 代码
- 2024-09-25Python编程基础详解
- 2024-09-25Python编程入门教程
- 2024-09-25从零开始使用Python构建LLaMA 3
- 2024-09-23Python中理解和使用树形结构的简单教程
- 2024-09-23Python 编程基础入门
- 2024-09-18初探Python股票自动化交易:入门指南
- 2024-09-18Python量化入门:轻松掌握量化分析基础与实战