【Python系列专栏】第六十五篇 Python中 Pandas 数据转换
2021/5/8 14:55:13
本文主要是介绍【Python系列专栏】第六十五篇 Python中 Pandas 数据转换,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
7.2 数据转换
Pandas 另一类重要操作是过滤、清理以及其他的转换工作。
7.2.1 移除重复数据
DataFrame的duplicated
方法返回一个布尔型Series,表示各行是否是重复行(前面出现过的行)。还有一个与此相关的drop_duplicates
方法,它会返回一个DataFrame,重复的数组会标为False。【这两种方法默认会判断全部列,也可以指定部分列进行重复项判断。例如,只希望根据某一列过滤重复项,只需要传参到上面的方法中。】
duplicated和drop_duplicates默认保留的是第一个出现的值组合。传入keep=‘last’则保留最后一个。
7.2.2 利用函数或映射进行数据转换
希望根据数组、Series或DataFrame列中的值来实现转换工作。
Series的map
方法可以接受一个函数或含有映射关系的字典型对象,但是如果碰到一些映射的对象中有些值的首字母大写了,而有些则没有,就需要使用Series
的str.lower
方法,将各个值转换为小写。
例如:
lowercased=data[
这篇关于【Python系列专栏】第六十五篇 Python中 Pandas 数据转换的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-24Python编程基础详解
- 2024-11-21Python编程基础教程
- 2024-11-20Python编程基础与实践
- 2024-11-20Python编程基础与高级应用
- 2024-11-19Python 基础编程教程
- 2024-11-19Python基础入门教程
- 2024-11-17在FastAPI项目中添加一个生产级别的数据库——本地环境搭建指南
- 2024-11-16`PyMuPDF4LLM`:提取PDF数据的神器
- 2024-11-16四种数据科学Web界面框架快速对比:Rio、Reflex、Streamlit和Plotly Dash
- 2024-11-14获取参数学习:Python编程入门教程