Appearance
第6章:聚类算法
本章将详细介绍scikit-learn中常用的聚类算法及其应用。
6.1 K-Means聚类
K-Means是最常用的聚类算法。
6.1.1 训练K-Means
使用KMeans进行聚类。
python
from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(X)6.2 层次聚类
层次聚类是一种基于树的聚类方法。
6.2.1 执行层次聚类
使用AgglomerativeClustering进行聚类。
python
from sklearn.cluster import AgglomerativeClustering
hc = AgglomerativeClustering(n_clusters=3)
hc.fit(X)6.3 DBSCAN和OPTICS
DBSCAN和OPTICS是基于密度的聚类算法。
6.3.1 训练DBSCAN
使用DBSCAN进行聚类。
python
from sklearn.cluster import DBSCAN
dbscan = DBSCAN(eps=0.5, min_samples=5)
dbscan.fit(X)6.3.2 训练OPTICS
使用OPTICS进行聚类。
python
from sklearn.cluster import OPTICS
optics = OPTICS(min_samples=10, xi=0.05, min_cluster_size=0.1)
optics.fit(X)6.4 本章小结
本章介绍了多种聚类算法,包括K-Means、层次聚类、DBSCAN和OPTICS。这些算法适用于不同的数据特点和聚类需求。
