python数据分析实战项目—10000条北京二手房多维度可视化分析(附源码)
2021/12/26 12:07:23
本文主要是介绍python数据分析实战项目—10000条北京二手房多维度可视化分析(附源码),对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
文章目录
- 开发工具
- 数据内容
- 实现代码
- 运行效果
- 10000条二手房信息下载地址
- 总结
开发工具
python版本:Python 3.6.1
python开发工具:JetBrains PyCharm 2018.3.6 x64
第三方库:pandas ;matplotlib ;seaborn
数据内容
实现代码
import pandas as pd import seaborn as sns import matplotlib.pyplot as plt plt.style.use('fivethirtyeight') sns.set_style({'font.sans-serif': ['simhei', 'Arial']}) lianjia_df = pd.read_csv('lianjia.csv') # 添加房屋均价 df = lianjia_df.copy() df['PerPrice'] = round(lianjia_df['Price'] / lianjia_df['Size'], 2) # 重新摆放列位置 columns = ['Region', 'District', 'Garden', 'Layout', 'Floor', 'Year', 'Size', 'Elevator', 'Direction', 'Renovation', 'PerPrice', 'Price'] df = pd.DataFrame(df, columns=columns) # 电梯异常数据处理 print(df.head()) df['Elevator'] = df.loc[(df['Elevator'] == '有电梯') | (df['Renovation'] == '无电梯'), 'Elevator'] # 填补Elevator缺失值 df.loc[(df['Floor'] > 6) & (df['Elevator'].isnull()), 'Elevator'] = '有电梯' df.loc[(df['Floor'] <= 6) & (df['Elevator'].isnull()), 'Elevator'] = '无电梯' # 装修特征异常数据处理 df['Renovation'] = df.loc[(df['Renovation'] != '南北'), 'Renovation'] # 去掉南北的异常值 # 在数据集的不同子集上绘制同一图的多个实例,格子图 grid = sns.FacetGrid(df, row='Elevator', col='Renovation', palette='seismic', height=6) # height控制参数内容显示 grid.map(plt.scatter, 'Year', 'Price') grid.add_legend() plt.show()
运行效果
可以看到图中看到价格,装修特征,有无电梯,和年份之间的关系
10000条二手房信息下载地址
https://url71.ctfile.com/f/13238771-530323628-1950bb
(访问密码:8835)
总结
这里主要运用了python的进行数据分析时,注意从图中分析异常数据,在对相关数据进行过滤掉
有问题欢迎在评论区中讨论
这篇关于python数据分析实战项目—10000条北京二手房多维度可视化分析(附源码)的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-10-04Python外包有哪些常见的主要库-icode9专业技术文章分享
- 2024-10-02基于深度学习的钢铁缺陷检测系统(yolov8、注意力机制、PyQt5界面、Python)
- 2024-10-01怎么用python搭建一个系统-icode9专业技术文章分享
- 2024-09-30Python基础入门教程
- 2024-09-30获取参数学习:Python中的基础教程
- 2024-09-30Python编程基础详解
- 2024-09-29点击加载学习:Python编程基础教程
- 2024-09-29数据科学五大Python前端库:第二部分
- 2024-09-27使用python 将ETH账户的资产打散
- 2024-09-26Python编程基础