盘点Python中4种读取json文件和提取json文件内容的方法
2021/12/15 22:14:49
本文主要是介绍盘点Python中4种读取json文件和提取json文件内容的方法,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
前言
前几天有粉丝在群里问了一个json文件处理的问题。
看上去他只需要follower和ddate这两个字段下的对应的值。
我们知道json是一种常见的数据传输形式,所以对于爬取数据的数据解析,json的相关操作是比较重要的,能够加快我们的数据提取效率。
思路
关于这个问题,倒不是很难,群里提出了三个方法,第一个是才哥说的pd处理或者正则表达式,第二个是小编自己提出的json处理,第三个是【成都-IT技术支持-小王】提出的jsonpath,总之方法很多,这里给出4个处理方法,希望下次粉丝们再遇到类似问题的时候,有章可循。
实现过程
1、正则表达式
这个方法可以看看,通过匹配的方法进行提取,代码如下所示:
import re import jsonfile = open('漫画.txt', 'r', encoding='utf-8') content = file.readlineddate_result1 = re.findall('"ddate":"(\d+\-\d+\-\d+)"', content) ddate_result2 = re.findall('"ddate":"(.*?)"', content) follower_result1 = re.findall('"follower":(\d+),"', content) print(ddate_result1) print(ddate_result2) print(follower_result1)
运行之后,可以得到结果:
关于ddate,follower获取的方法肯定还有很多其他写法,这里只是抛砖引玉,欢迎大家多多尝试。
2、jsonpath方法一
关于jsonpath的用法,之前在这篇文章中有提及,感兴趣的小伙伴也可以去看看:数据提取之JSON与JsonPATH。
下面是【成都-IT技术支持-小王】大佬给的代码:
from jsonpath import jsonpath import json"""follower和ddate""" with open("漫画.txt", encoding="utf-8") as file: file_json = json.loads(file.readline)follower = jsonpath(file_json, "$..follower") ddate = jsonpath(file_json, "$..ddate") print(follower)print(ddate)
代码运行之后,就会得到想要的数据,如下图所示:
这个..就和xpath里面的//一样,子孙节点,$是根节点。
3、jsonpath方法二
这个是另外一个用法了,小号【皮皮】提供的,直接上代码。
import json import jsonpath# obj = json.load(open('罗翔.json', 'r', encoding='utf-8')) # 注意,这里是文件的形式,不能直接放一个文件名的字符串 file = open('漫画.txt', 'r', encoding='utf-8') # 注意,这里是文件的形式,不能直接放一个文件名的字符串 obj = json.loads(file.readline)follower = jsonpath.jsonpath(obj, '$..follower') # 文件对象 jsonpath语法 ddate = jsonpath.jsonpath(obj, '$..ddate') # 文件对象 jsonpath语法 print(follower) print(ddate)
代码运行之后,也可以得到预期的结果。
当然了,如果你的文件本来就是json文件,也可以直接读取,代码类似:
import json import jsonpathobj = json.load(open('罗翔.json', 'r', encoding='utf-8')) # 注意,这里是文件的形式,不能直接放一个文件名的字符串 # file = open('罗翔.json', 'r', encoding='utf-8') # 注意,这里是文件的形式,不能直接放一个文件名的字符串 # obj = json.loads(file.readline)follower = jsonpath.jsonpath(obj, '$..follower') # 文件对象 jsonpath语法 ddate = jsonpath.jsonpath(obj, '$..ddate') # 文件对象 jsonpath语法 print(follower) print(ddate)
运行之后,也可以得到预期的结果:
4、jsonpath方法三
这个是群里【深圳-Hua Bro】华博提供的,代码如下:
import json import jsonpathwith open("罗翔.txt", 'r', encoding="UTF-8") as fr: file_json = eval(fr.read.replace('\n\u200b', '')) # 读取的str转为字典 follower = jsonpath.jsonpath(file_json, '$..follower') # 文件对象 jsonpath语法 ddate = jsonpath.jsonpath(file_json, '$..ddate') # 文件对象 jsonpath语法 print(follower) print(ddate)
方法大同小异,运行之后,也可以拿到预取的目标数据,如下图所示。
这篇关于盘点Python中4种读取json文件和提取json文件内容的方法的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-12-26React入门教程:从零开始搭建你的第一个React应用
- 2024-12-25Vue2入门教程:轻松掌握前端开发基础
- 2024-12-25Vue3入门指南:快速搭建你的第一个Vue3项目
- 2024-12-25JS基础知识入门教程
- 2024-12-25React基础知识详解:从入门到初级应用
- 2024-12-25Vue3基础知识详解与实战指南
- 2024-12-25Vue3学习:从入门到初步掌握
- 2024-12-25Vue3入门:新手必读的简单教程
- 2024-12-23【JS逆向百例】爱疯官网登录逆向分析
- 2024-12-21Vue3教程:新手入门到实践应用