网站首页 站内搜索

搜索结果

查询Tags标签: 聚类,共有 164条记录
  • k-means++算法选择初始seeds的基本思想就是:初始的聚类中心之间的相互距离要尽可能的远——sklearn内置该算法

    k-means ++介绍:k-means++算法选择初始seeds的基本思想就是:初始的聚类中心之间的相互距离要尽可能的远。算法步骤:(1)从输入的数据点集合中随机选择一个点作为第一个聚类中心(2)对于数据集中的每一个点x,计算它与最近聚类中心(指已选择的聚类中心)的距离D(x)(3)…

    2021/8/6 11:05:49 人评论 次浏览
  • DBSCAN算法理解

    DBSCAN算法理解 1.DBSCAN简介 DBSCAN(Density-Based Special Clustering of Application with Noise),它是基于密度聚类算法,密度可以理解为样本点的紧密程度,而紧密度的衡量则需要使用半径和最小样本量进行评估,如果在指定的半径内,实际样本量超过给定的最小样本量…

    2021/8/4 14:06:35 人评论 次浏览
  • DBSCAN算法理解

    DBSCAN算法理解 1.DBSCAN简介 DBSCAN(Density-Based Special Clustering of Application with Noise),它是基于密度聚类算法,密度可以理解为样本点的紧密程度,而紧密度的衡量则需要使用半径和最小样本量进行评估,如果在指定的半径内,实际样本量超过给定的最小样本量…

    2021/8/4 14:06:35 人评论 次浏览
  • Python 不调包实现Hierarchical Clustering——层次聚类(合并法)

    提示:本文不调用sklearn等包,直接使用numpy和pandas完成了Hierarchical Clustering,即层次聚类算法的实现。文章目录 一、Hierarchical Clustering之算法原理二、python源码1.Hierarchical Clustering.py2.读入数据 总结一、Hierarchical Clustering之算法原理 算法介绍…

    2021/7/28 22:06:28 人评论 次浏览
  • Python 不调包实现Hierarchical Clustering——层次聚类(合并法)

    提示:本文不调用sklearn等包,直接使用numpy和pandas完成了Hierarchical Clustering,即层次聚类算法的实现。文章目录 一、Hierarchical Clustering之算法原理二、python源码1.Hierarchical Clustering.py2.读入数据 总结一、Hierarchical Clustering之算法原理 算法介绍…

    2021/7/28 22:06:28 人评论 次浏览
  • 【数据分析】基于FastNewman实现数据聚类matlab源码

    一、简介 一、社区的定义 ​ Newman第一次提出模块度定义就是在2004年发表的这篇文章“fast algorithm for community structure in networks”,第一次用量化的公式来确定社区划分。 ​ 首先,我们来看Newman如何定义社区的:the vertices in networks are often found t…

    2021/7/9 14:09:08 人评论 次浏览
  • 08 机器学习 - Kmeans聚类算法原理

    1.概述 K-means算法是集简单和经典于一身的基于距离的聚类算法 采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。 该算法认为类簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。2 算法图示 假设我们的n个样本点分布在图中所…

    2021/7/8 11:11:53 人评论 次浏览
  • 09 机器学习 - Kmeans聚类算法案例

    1. 需求 对给定的数据集进行聚类 本案例采用二维数据集,共80个样本,有4个类。样例如下(testSet.txt): 1.658985 4.285136 -3.453687 3.424321 4.838138 -1.151539 -5.379713 -3.362104 0.972564 2.924086 -3.567919 1.531611 0.450614 -3.302219 -3.48710…

    2021/7/8 11:11:47 人评论 次浏览
  • python数据分析与挖掘实战---航空公司客户价值分析

    航空公司客户价值分析 一、 背景与挖掘目标客户关系管理是企业的核心问题,关键在于客户的分类:区别无价值客户,高价值客户,针对不同客户群体有的放矢投放具体服务方案,实现企业利润最大化的目标。 各大航空公司采取优惠措施喜迎更多客户,国内航司面对客户流失和资源…

    2021/7/7 17:09:29 人评论 次浏览
  • 基于聚类算法的航空客户价值分析的学习总结

    根据下面的网站进行的学习 https://work.datafountain.cn/forum?id=67&type=2 一般情况下拿到数据进行分析,首先要对数据进行预处理,根据经典的特征工程选取相应的特征向量,前几步一般都是一样的,然后进行模型训练与数据预测,最后进行决策分析。首先要导入一些机…

    2021/7/2 1:23:05 人评论 次浏览
  • 机器学习sklearn(65):算法实例(二十二)聚类(五)KMeans (三) 总结

    1 KMeans参数列表 2 KMeans属性列表3 KMeans接口列表

    2021/6/29 20:50:42 人评论 次浏览
  • 拓端tecdat|R语言聚类有效性:确定最优聚类数分析IRIS鸢尾花数据和可视化

    原文链接:http://tecdat.cn/?p=22879 原文出处:拓端数据部落公众号 数据集概述 这个数据集常用于数据概述、可视化和聚类模型。它包括三个鸢尾花品种,每个品种有50个样本,以及一些属性。其中一个花种与其他两个花种是线性可分离的,但其他两个花种之间不是线性可分离…

    2021/6/29 6:22:22 人评论 次浏览
  • 拓端tecdat|R语言k-means聚类、层次聚类、主成分(PCA)降维及可视化分析鸢尾花iris数据集

    原文链接:http://tecdat.cn/?p=22838 原文出处:拓端数据部落公众号问题:使用R中的鸢尾花数据集 (a)部分:k-means聚类使用k-means聚类法将数据集聚成2组。 画一个图来显示聚类的情况使用k-means聚类法将数据集聚成3组。画一个图来显示聚类的情况(b)部分:层次聚类使用…

    2021/6/29 6:22:17 人评论 次浏览
  • 聚类算法

    参考资料:https://www.cnblogs.com/liujinhong/p/6001997.html https://blog.csdn.net/zaishuiyifangxym/article/details/89488420 https://blog.csdn.net/weixin_42056745/article/details/101287231所谓聚类问题,就是给定一个元素集合 D,其中每个元素具有 n 个可观察…

    2021/6/29 1:21:41 人评论 次浏览
  • 机器学习sklearn(62):算法实例(十九)聚类(二)KMeans

    1 KMeans是如何工作的 2 簇内误差平方和的定义和解惑 3 KMeans算法的时间复杂度

    2021/6/28 22:21:01 人评论 次浏览
扫一扫关注最新编程教程