《python网络爬虫入门实践》笔记:chp3 静态网页抓取(下)实例:豆瓣电影top250
2021/11/24 12:10:28
本文主要是介绍《python网络爬虫入门实践》笔记:chp3 静态网页抓取(下)实例:豆瓣电影top250,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
import requests from bs4 import BeautifulSoup def get_movies(): Headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)' ' Chrome/95.0.4638.69 Safari/537.36 Edg/95.0.1020.44', 'Host': 'movie.douban.com'} movie_list = [] for i in range(0, 10): # 构造25页的url link = "https://movie.douban.com/top250?start=" + str(i * 25) + "&filter=" r = requests.get(link, headers=Headers) print(str(i + 1), "页面响应状态码", r.status_code) soup = BeautifulSoup(r.text, "html.parser") div_list = soup.find_all("div", class_="hd") for each in div_list: movie = each.a.span.get_text() movie_list.append(movie) return movie_list movies = get_movies() print(movies)
这篇关于《python网络爬虫入门实践》笔记:chp3 静态网页抓取(下)实例:豆瓣电影top250的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-24Python编程基础详解
- 2024-11-21Python编程基础教程
- 2024-11-20Python编程基础与实践
- 2024-11-20Python编程基础与高级应用
- 2024-11-19Python 基础编程教程
- 2024-11-19Python基础入门教程
- 2024-11-17在FastAPI项目中添加一个生产级别的数据库——本地环境搭建指南
- 2024-11-16`PyMuPDF4LLM`:提取PDF数据的神器
- 2024-11-16四种数据科学Web界面框架快速对比:Rio、Reflex、Streamlit和Plotly Dash
- 2024-11-14获取参数学习:Python编程入门教程