我在B站上课,某博士教我如何PYTHON爬虫 上课笔记 (1)
2021/7/19 20:39:19
本文主要是介绍我在B站上课,某博士教我如何PYTHON爬虫 上课笔记 (1),对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
Python爬虫知识点整理
mongodb数据库 介于关系型数据和非关新型书库
依据关系模型创建的数据库 1-1 1- 对多 多-多
特点 安全 但是不节省空间 仍要分配空间
非关系模型 HBASE 列
文档类模型 MongoDB 缺点转存到磁盘中
键值对
Win10
www.mongodb.com/try/download/community
下载好mongodb 之后,确定用nvicat链接
Netstat -an
出现这个27017的端口 MONGO就安装完了
Requests模块支持的服务
GET:当客户端向 WEB服务器请求一个资源的时候使用
GET
Requests模块支持的http方法
PUT:当客户端向Web服务端URL发送一个替换的文档或者上传一个新文档的时候使用
Response
GET: 当客户端向Web服务器请求一个资源的时候使用
Get方法是最简单最常用的请求方法
他被用来访问静态资源 html文档或图片
HEAD 当客户端向Web服务器请求一个资源的一些信息而不是资源的全部信息的时候使用
主要用于确认URL的有效性以及资源更新的日期时间等
POST 当客户端向服务端发送信息或者数据的时候使用,表单提交
PUT 一般指客户端向Web服务端指定URL发送一个替换的文档或者上传一个新文档的时候使用
DELETE 尝试从WEB服务端删除一个由请求URL唯一识别的文档使用
request header请求头 数据
外网IP地址为
117.100.126.51
通过百度搜索查询到的
这是内网IP 如果是 阿里云服务器 或者腾讯服务器的IP就不再是以192.开头了
提交密码的时候常见
以下是求出过程
通过 JSON求IP地址
Print(response.status_code) 传回状态码
200 成功 302 跳转 404 错误 500 遇到了一些闻所未闻的状态
请求超时: 设置?
异常 如果遇到连接问题 会抛出connnection异常
设置代理,隐藏请求
通过get请求访问登录页面还没有填用户名密码
-t时间戳
代理
找到IP地址的方法 http://pv.sohu.com/cityjson 通过这个URL访问IP地址也可以
#1 挑选代理厂商 阿布云 知名代理 快代理
把代理信息设置到代码中
Proxy ={
“http”:”http://”
不写了 还有好多才看到第八个视频
/.当前节点 /。。当前副标题
/spon
这篇关于我在B站上课,某博士教我如何PYTHON爬虫 上课笔记 (1)的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-24Python编程基础详解
- 2024-11-21Python编程基础教程
- 2024-11-20Python编程基础与实践
- 2024-11-20Python编程基础与高级应用
- 2024-11-19Python 基础编程教程
- 2024-11-19Python基础入门教程
- 2024-11-17在FastAPI项目中添加一个生产级别的数据库——本地环境搭建指南
- 2024-11-16`PyMuPDF4LLM`:提取PDF数据的神器
- 2024-11-16四种数据科学Web界面框架快速对比:Rio、Reflex、Streamlit和Plotly Dash
- 2024-11-14获取参数学习:Python编程入门教程