第6章：聚类算法

本章将详细介绍scikit-learn中常用的聚类算法及其应用。

6.1 K-Means聚类

K-Means是最常用的聚类算法。

使用KMeans进行聚类。

python

from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(X)

层次聚类是一种基于树的聚类方法。

使用AgglomerativeClustering进行聚类。

python

from sklearn.cluster import AgglomerativeClustering
hc = AgglomerativeClustering(n_clusters=3)
hc.fit(X)

DBSCAN和OPTICS是基于密度的聚类算法。

使用DBSCAN进行聚类。

python

from sklearn.cluster import DBSCAN
dbscan = DBSCAN(eps=0.5, min_samples=5)
dbscan.fit(X)

使用OPTICS进行聚类。

python

from sklearn.cluster import OPTICS
optics = OPTICS(min_samples=10, xi=0.05, min_cluster_size=0.1)
optics.fit(X)

本章介绍了多种聚类算法，包括K-Means、层次聚类、DBSCAN和OPTICS。这些算法适用于不同的数据特点和聚类需求。