Skip to content

第6章:聚类算法

本章将详细介绍scikit-learn中常用的聚类算法及其应用。

6.1 K-Means聚类

K-Means是最常用的聚类算法。

6.1.1 训练K-Means

使用KMeans进行聚类。

python
from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(X)

6.2 层次聚类

层次聚类是一种基于树的聚类方法。

6.2.1 执行层次聚类

使用AgglomerativeClustering进行聚类。

python
from sklearn.cluster import AgglomerativeClustering
hc = AgglomerativeClustering(n_clusters=3)
hc.fit(X)

6.3 DBSCAN和OPTICS

DBSCAN和OPTICS是基于密度的聚类算法。

6.3.1 训练DBSCAN

使用DBSCAN进行聚类。

python
from sklearn.cluster import DBSCAN
dbscan = DBSCAN(eps=0.5, min_samples=5)
dbscan.fit(X)

6.3.2 训练OPTICS

使用OPTICS进行聚类。

python
from sklearn.cluster import OPTICS
optics = OPTICS(min_samples=10, xi=0.05, min_cluster_size=0.1)
optics.fit(X)

6.4 本章小结

本章介绍了多种聚类算法,包括K-Means、层次聚类、DBSCAN和OPTICS。这些算法适用于不同的数据特点和聚类需求。