继续用python给女朋友挑钻石(小提琴图和箱线图)
2021/10/23 12:09:56
本文主要是介绍继续用python给女朋友挑钻石(小提琴图和箱线图),对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
文章目录
- 箱线图
- 增强箱线图
- 小提琴图
想不到大家都这么喜欢用python给女朋友挑钻石,所以我又写了个续。
如果看过这篇用python给女朋友挑钻石,那么可以直接从箱线图开始读。
seaborn是matplotlib的补充包,提供了一系列高颜值的figure,并且集成了多种在线数据集,通过sns.load_dataset()
进行调用,可供学习,如果网络不稳定,可下载到本地,然后在调用的时候使用把cache
设为True
。
其中,diamonds
数据集中包含了钻石数据,总计十项,分别是[重量/克拉]carat
、切割水平cut
、颜色color
、透明度clarity
、深度depth
、table
、价格price
以及x
、y
、z
方向的尺寸。
画图第一步就是导入包和数据。
import seaborn as sns import matplotlib.pyplot as plt # 本地加载数据集 dia = sns.load_dataset("diamonds",data_home="seaborn-data", cache=True) # 以上几行代码后面不再重复书写
箱线图
现在我们想知道Premium, Fair, Very Good, Good, Ideal这五种切割方式所对应的价格区间,那么最直接的想法是做一个箱线图,就类似K线那种图。
这个图中,箱和线描述了五个统计量:最小非异常值、第一四分位数(25%)、中位数、第三四分位数(75%)以及非异常最大值。而最大值上面的那些点,则为异常值。可见,超过1.5万刀的钻石属于异类。
>>> sns.boxplot(x="cut",y="price",data=dia,color='lightblue',fliersize=0.25) >>> plt.show()
其中,fliersize
表示异常值的尺寸。
增强箱线图
箱线图尽管已经可以描述一定的分布特性,但是还不够,毕竟只有5个统计量。
sns中提供了增强版的箱线图:boxenplot
在这个图中,将价格区间进行了划分,每个价格区间中,箱子越宽则代表样本越多。
sns.boxenplot(x="cut",y="price",data=dia, palette="ch:rot=-.5,d=.3_r") plt.show()
小提琴图
如果想再细致一点,那么就得用小提琴图了
sns.violinplot(x="cut",y="price",data=dia) sns.despine(left=True)
这样一看,切割最好的钻石,价格区间竟然以1000左右为主,尽管离谱,但也很真实了。
这篇关于继续用python给女朋友挑钻石(小提琴图和箱线图)的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-14获取参数学习:Python编程入门教程
- 2024-11-14Python编程基础入门
- 2024-11-14Python编程入门指南
- 2024-11-13Python基础教程
- 2024-11-12Python编程基础指南
- 2024-11-12Python基础编程教程
- 2024-11-08Python编程基础与实践示例
- 2024-11-07Python编程基础指南
- 2024-11-06Python编程基础入门指南
- 2024-11-06怎么使用python 计算两个GPS的距离功能-icode9专业技术文章分享