k均值聚类方法是一种无监督机器学习技术,用于识别数据集中的数据对象集群。有许多不同类型的聚类方法,但k -means是最古老和最平易近人的方法之一。这些特性使得在 Python 中实现k -means 聚类相当简单。
文章目录
-
- 一、什么是聚类
-
- 1.1 定义
- 1.2 主流的聚类算法
- 1.3 kmeans聚类
- 1.4 介绍
- 1.5 实现流程
- 二、案例实现
-
- 2.1 数据准备
- 2.2 确定最佳k(拐肘法)
- 2.3 重新训练
- 2.4 集群可视化
- 三、K均值聚类的优缺点
-
- 3.1 优点
- 3.2 缺点
物以聚类。
一、什么是聚类 1.1 定义聚类是一组用于将数据划分为组或集群的技术。集群被松散地定义为与其集群中的其他对象相比与其他集群中的数据对象更相似的数据对象组。
关注
打赏