使用 NumPy 进行数据处理——数据科学第 185 天
2022/8/28 23:23:35
本文主要是介绍使用 NumPy 进行数据处理——数据科学第 185 天,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
使用 NumPy 进行数据预处理——数据科学第 185 天
Source: https://numpy.org/
上次,我们查看了安装 NumPy 包并探索了使用 NumPy 的数组的基础知识。 — 是的,上次是第 184 天,但我在发表文章时打错了字。
[
使用 NumPy 进行数据处理——数据科学第 146 天
是的,已经有一段时间了。准确地说,我离开了两个半月,其他项目占用了我更多的时间……
媒体网
](/vizneo-academy/data-processing-with-numpy-data-science-day-146-dabb87e97a28)
今天,我们来看看如何在 NumPy 中使用统计函数。
例如,您可以设置以下数组:
matrix_A = np.array([[1,0,0,3,1],[3,6,6,2,9],[4,5,3,8,0]]) 矩阵_A #输出-> 数组([[1, 0, 0, 3, 1], [3, 6, 6, 2, 9], [4, 5, 3, 8, 0]])
如果您获取所有值并将它们排序在一个列表中,您将获得一个值列表。
np.sort(矩阵_A,轴=无) #输出-> 数组([0, 0, 0, 1, 1, 2, 3, 3, 3, 4, 5, 6, 6, 8, 9])
通过在这个数组上应用中位数,它应该给出列表中的中间值。
np.median(matrix_A) #输出-> 3.0
平均值返回一个浮点数
np.mean(matrix_A) #输出-> 3.4
数组的方差给出
np.var(matrix_A) #输出-> 7.84
标准差
np.std(matrix_A) #输出-> 2.8
现在,测试 2.8² 也等于方差 7.84
np.std(matrix_A)**2 #输出-> 7.839999999999999
所以看起来是正确的。
继续使用直方图,在这种情况下显示来自数组的数值数据的频率。
matrix_A = np.array([[1,0,0,3,1],[3,6,6,2,9],[4,5,3,8,0]]) 矩阵_A #输出-> 数组([[1, 0, 0, 3, 1], [3, 6, 6, 2, 9], [4, 5, 3, 8, 0]]) np.sort(矩阵_A,轴=无) #输出-> 数组([0, 0, 0, 1, 1, 2, 3, 3, 3, 4, 5, 6, 6, 8, 9]) # 我们可以看到值的频率 np.histogram(matrix_A, bins = 10, range = (0,9)) #输出-> (数组([3, 2, 1, 3, 1, 1, 2, 0, 1, 1]), 数组([0., 0.9, 1.8, 2.7, 3.6, 4.5, 5.4, 6.3, 7.2, 8.1, 9. ]))
直方图数组有两个值列表,其中第一个显示 bin 中每个值范围的频率。在这种情况下,bin 被定义为 10 个 bin,从 0 到 9。
通过使用 matplotlib,我们可以说明直方图:
将 matplotlib.pyplot 导入为 plt plt.hist(matrix_A.flat, bins = np.histogram(matrix_A)[1]) plt.show()
Author image
未完待续…
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明
本文链接:https://www.qanswer.top/1348/52422817
这篇关于使用 NumPy 进行数据处理——数据科学第 185 天的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-23Springboot应用的多环境打包入门
- 2024-11-23Springboot应用的生产发布入门教程
- 2024-11-23Python编程入门指南
- 2024-11-23Java创业入门:从零开始的编程之旅
- 2024-11-23Java创业入门:新手必读的Java编程与创业指南
- 2024-11-23Java对接阿里云智能语音服务入门详解
- 2024-11-23Java对接阿里云智能语音服务入门教程
- 2024-11-23JAVA对接阿里云智能语音服务入门教程
- 2024-11-23Java副业入门:初学者的简单教程
- 2024-11-23JAVA副业入门:初学者的实战指南