python_bs对象的select()方法
2022/1/19 17:24:06
本文主要是介绍python_bs对象的select()方法,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
准备
导包并以这段HTML源码为例,创建一个bs对象。
from bs4 import BeautifulSoup html_doc = """ <html><head><title>The Dormouse's story</title></head> <body> <p class="title"><b>The Dormouse's story</b></p> <p class="story">Once upon a time there were three little sisters; and their names were <a href="http://example.com/elsie" class="sister" id="link1">Elsie</a>, <a href="http://example.com/lacie" class="sister" id="link2">Lacie</a> and <a href="http://example.com/tillie" class="sister" id="link3">Tillie</a>; and they lived at the bottom of a well.</p> """ soup = BeautifulSoup(html_doc, 'lxml')
获取所有<a>标签
print(soup.select('a'))
输出结果为一个列表
获取class属性为指定值的标签
筛选出class='sister’的标签:
在指定class属性值前加点符号表示class:
print(soup.select('.sister'))
获取id属性为指定值的标签
筛选出id值为link1的标签:
在指定的id属性值前加井号表示id:
print(soup.select('#link1'))
获取指定文本
- .string()
- .get_text()
# 获取title标签当中的文本 print(soup.select('title')) print('_'*100) print(soup.select('title')[0].string) print('_'*100) print(soup.select('title')[0].get_text())
输出结果:
获取指定标签的指定属性:
获取所有<a>标签的href属性
a_tag = soup.select('a') for i in a_tag: print(i['href'])
(i是标签对象,i.href不管用。)
这篇关于python_bs对象的select()方法的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-24Python编程基础详解
- 2024-11-21Python编程基础教程
- 2024-11-20Python编程基础与实践
- 2024-11-20Python编程基础与高级应用
- 2024-11-19Python 基础编程教程
- 2024-11-19Python基础入门教程
- 2024-11-17在FastAPI项目中添加一个生产级别的数据库——本地环境搭建指南
- 2024-11-16`PyMuPDF4LLM`:提取PDF数据的神器
- 2024-11-16四种数据科学Web界面框架快速对比:Rio、Reflex、Streamlit和Plotly Dash
- 2024-11-14获取参数学习:Python编程入门教程