Python爬取微博热搜榜,将数据存入数据库
2021/7/17 19:09:02
本文主要是介绍Python爬取微博热搜榜,将数据存入数据库,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
#-*-coding:utf-8-*- import urllib, pymysql, requests, re # 配置数据库 config = { 'host': '127.0.0.1', 'port': 3306, 'user': 'root', 'password': '******', 'db': 'weibo', 'charset': 'utf8', } # 链接数据库 conn = pymysql.connect(**config) cursor = conn.cursor() # 获取热搜源码 weiboHotFile = requests.get('http://s.weibo.com/top/summary') weiboHotHtml = weiboHotFile.text # 正则表达式匹配URL,找到title hotKey = re.compile(r'td class=\\"td_05\\"><a href=\\"\\/weibo\\/(.*?)&Refer=top\\"') hotKeyListBe = hotKey.findall(weiboHotHtml) rank = 1 # 遍历获取的title列表 for title in hotKeyListBe: # 去除干扰数字 title = title.replace('25', '') url = 'http://s.weibo.com/weibo/' + title title = urllib.parse.unquote(title) print(str(rank)+' '+title + ' '+' '+url+'\n') # 执行数据语句 sql = 'insert into hotsearch (rank, daydate, mindate, title, url) values (%s, curdate(), curtime(), %s, %s)' cursor.execute(sql, (rank, title, url)) rank += 1 conn.commit() cursor.close() conn.close()
这篇关于Python爬取微博热搜榜,将数据存入数据库的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-24Python编程基础详解
- 2024-11-21Python编程基础教程
- 2024-11-20Python编程基础与实践
- 2024-11-20Python编程基础与高级应用
- 2024-11-19Python 基础编程教程
- 2024-11-19Python基础入门教程
- 2024-11-17在FastAPI项目中添加一个生产级别的数据库——本地环境搭建指南
- 2024-11-16`PyMuPDF4LLM`:提取PDF数据的神器
- 2024-11-16四种数据科学Web界面框架快速对比:Rio、Reflex、Streamlit和Plotly Dash
- 2024-11-14获取参数学习:Python编程入门教程