01-第一个爬虫程序
2021/12/11 1:18:25
本文主要是介绍01-第一个爬虫程序,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
from urllib.request import urlopen url = "http://www.baidu.com" resp = urlopen(url) with open("mybaidu.html", mode="w", encoding="utf-8") as f: f.write(resp.read().decode("utf-8")) print("over!")
之后会把百度的源代码爬下来,放到一个mybaidu.html文件中。
注意:
open这个函数,默认使用的编码解码方式,是我们平台默认的编码方式,windows是gbk。但是百度默认编码方式是utf-8,因此如果不使用encoding="utf-8"进行转换的话,会出现乱码
这篇关于01-第一个爬虫程序的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-07-04TiDB 资源管控的对撞测试以及最佳实践架构
- 2024-07-03万字长文聊聊Web3的组成架构
- 2024-07-02springboot项目无法注册到nacos-icode9专业技术文章分享
- 2024-06-26结对编程到底难不难?答案在这里
- 2024-06-19《2023版Java工程师》课程升级公告
- 2024-06-15matplotlib作图不显示3D图,怎么办?
- 2024-06-1503-Loki 日志监控
- 2024-06-1504-让LLM理解知识 -Prompt
- 2024-06-05做软件测试需要懂代码吗?
- 2024-06-0514-ShardingSphere的分布式主键实现