python通过selenium获取网页信息可以绕过反扒系统
2021/9/10 20:06:53
本文主要是介绍python通过selenium获取网页信息可以绕过反扒系统,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
加载selenium控件:
pip intall selenium;pip show selenium
web下载地址:
chrome浏览器,chrome插件,谷歌浏览器下载,谈笑有鸿儒 (chromedownloads.net)
配置环境变量path:C:\Program Files\Python38
完整代码:
import requests from bs4 import BeautifulSoup from datetime import datetime import json import xlwt import xlwings as xw from selenium import webdriver import time from selenium.webdriver import Chrome, ChromeOptions opt = ChromeOptions() # 创建Chrome参数对象 opt.headless = True # 把Chrome设置成可视化无界面模式,windows/Linux 皆可 driver = Chrome(options=opt) # driver = webdriver.Chrome() driver.get('http://emweb.eastmoney.com/PC_HSF10/OperationsRequired/Index?type=web&code=SH601600') html=BeautifulSoup(driver.page_source,'html.parser') time.sleep(2) source =driver.page_source # driver.find_element_by_id().send_keys() # driver.find_element_by_name() # driver.find_elements_by_class_name() with open('rrBand.html', 'w') as f: f.write(source) # print(html) html.list=html.find_all('div',attrs={'class':'sckrox'}) print(html.list) driver .quit() # str=['中国铝业','中国核电','中国'] # print(str[1])
这篇关于python通过selenium获取网页信息可以绕过反扒系统的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-16`PyMuPDF4LLM`:提取PDF数据的神器
- 2024-11-16四种数据科学Web界面框架快速对比:Rio、Reflex、Streamlit和Plotly Dash
- 2024-11-14获取参数学习:Python编程入门教程
- 2024-11-14Python编程基础入门
- 2024-11-14Python编程入门指南
- 2024-11-13Python基础教程
- 2024-11-12Python编程基础指南
- 2024-11-12Python基础编程教程
- 2024-11-08Python编程基础与实践示例
- 2024-11-07Python编程基础指南