网页采集器练习

2021/8/21 23:06:52

本文主要是介绍网页采集器练习,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

 1 import requests
 2 if __name__ == "__main__":
 3     header = {
 4         "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3868.400 QQBrowser/10.8.4394.400"
 5     }
 6 # UA伪装,将对应的User-Agent封装到一个字典中
 7     url = "https://www.baidu.com/s"
 8 # 指定url
 9     kw = input("请输入您要搜索的内容:")
10     param = {
11         "wd": kw
12     }
13 # 对指定的url发起的请求对应的url是携带参数的,并且请求过程中处理了参数
14     response = requests.get(url=url, params=param, headers=header)
15     page_text = response.text
16     fileName = kw+".html"
17     with open(fileName, "w", encoding="utf-8") as fp:
18         fp.write(page_text)
19     print(fileName, "保存成功!!!")

 



这篇关于网页采集器练习的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程