Python 数据处理常用语法
2022/7/17 1:15:02
本文主要是介绍Python 数据处理常用语法,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
- 删除某列包含特定字符的行
data = data.drop(data[data['房号'].str.contains('车位','车库')].index)
- 处理日期数据
data['合同签订日期'] = pd.to_datetime(data['合同签订日期'])
- 获取年份
data.loc[:,'签约年份'] = data.loc[:,'签约日期'].apply(lambda x: x.year).astype(int)
- 将数据分段
默认right为真,即左开右闭;为假,则左闭右开
data.loc[:,'分类'] = pd.cut(data['未开工时间'],bins=[0,1,3,12],labels=['1年未开工','1-3年未开工','3年以上未开工'])
- 截取特定位置的字符
不清楚原理,但是当使用data.loc[:,'合同签订年份']时,会报错,采用下面的语法则不会。
data['合同签订年份'] = data['合同编号'].apply(lambda x: x[7:11]).astype(int)
- 移除字符串前后特定字符
data.loc[:,'证件号'] = data.loc[:, '证件号'].apply(lambda x: x.strip())
- 删除为空的行
data = data.dropna(subset=['合同总价'])
- 根据某列数据修改其他某列数据
data['居住地省份'] = data.apply(lambda row: '本市' if (row['居住地省份'] == '广东') and (row['居住地城市'] in ['湛江','廉江','遂溪','吴川','赤坎','坡头','霞山','麻章','雷州','徐闻','经济']) else row['居住地省份'], axis=1)
- 将数据分组和重新整理
mjfd = data.groupby(['所属区县'],data['签约年份'])['面积分段'].count() # 数据格式需要强制转化,series 转 dataframe mjfd = mjfd.loc[:,:].to_frame() mjfd = pd.pivot_table(mjfd,index=['所属区县','面积分段'], columns='签约年份')
- 匹配保留数字匹配项
data['购房者出生年份'] = data['购房者出生年份'].apply(lambda x: re.sub(r'[^0-9]', '', x))
- 筛选出特定长度字符数据
data = data[data['购房者出生年份'].str.len()==4]
这篇关于Python 数据处理常用语法的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-14获取参数学习:Python编程入门教程
- 2024-11-14Python编程基础入门
- 2024-11-14Python编程入门指南
- 2024-11-13Python基础教程
- 2024-11-12Python编程基础指南
- 2024-11-12Python基础编程教程
- 2024-11-08Python编程基础与实践示例
- 2024-11-07Python编程基础指南
- 2024-11-06Python编程基础入门指南
- 2024-11-06怎么使用python 计算两个GPS的距离功能-icode9专业技术文章分享