机器学习—聚类算法
2022/7/2 1:22:31
本文主要是介绍机器学习—聚类算法,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
聚类(Clustering)
是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。也即聚类后同一类的数据尽可能聚集到一起,不同类数据尽量分离。
1.K-Means聚类鸢尾花数据
from sklearn.datasets import load_iris import numpy as np iris = load_iris() data = iris.data n = len(data) k = 2 dist = np.zeros([n, k+1]) # 1、选中心 center = data[:k, :] center_new = np.zeros([k, data.shape[1]]) while True: # 2、求距离 for i in range(n): for j in range(k): dist[i, j] = np.sqrt(sum((data[i, :] - center[j, :])**2)) dist[i, k] = np.argmin(dist[i, :k]) # 3、归类 for i in range(k): # 4、求新类中心 index = dist[:, k] == i center_new[i, :] = data[index, :].mean(axis=0) if np.all(center == center_new): # 5、判定结束 break center = center_new
2.调用sklearn实现聚类分析
from sklearn.datasets import load_iris from sklearn.cluster import KMeans iris = load_iris() model = KMeans(n_clusters=3).fit(iris.data) print(model.labels_)
3.参考文章
【聚类】五种主要聚类算法_
机器学习(7)——聚类算法 - 简书
【创作不易,望点赞收藏,若有疑问,请留言,谢谢】
这篇关于机器学习—聚类算法的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-10-28机器学习资料入门指南
- 2024-10-25机器学习开发的几大威胁及解决之道
- 2024-10-24以下是五个必备的MLOps (机器学习运维)工具,帮助提升你的生产效率 ??
- 2024-10-15如何选择最佳的机器学习部署策略:云 vs. 边缘
- 2024-10-12从软件工程师转行成为机器学习工程师
- 2024-09-262024年机器学习路线图:精通之路步步为营指南
- 2024-09-13机器学习教程:初学者指南
- 2024-08-07从入门到精通:全面解析机器学习基础与实践
- 2024-01-24手把手教你使用MDK仿真调试
- 2024-01-10基于“小数据”的机器学习