Skip to content

第4章:分类算法

本章将详细介绍scikit-learn中常用的分类算法及其应用。

4.1 决策树分类器

决策树是一种直观的分类方法。

4.1.1 训练决策树

使用DecisionTreeClassifier进行分类。

python
from sklearn.tree import DecisionTreeClassifier
clf = DecisionTreeClassifier(random_state=42)
clf.fit(X_train, y_train)

4.2 支持向量机

支持向量机(SVM)是一种强大的分类器。

4.2.1 训练SVM

使用SVC进行分类。

python
from sklearn.svm import SVC
svm = SVC(random_state=42)
svm.fit(X_train, y_train)

4.3 随机森林和梯度提升树

随机森林和梯度提升树是集成学习方法。

4.3.1 训练随机森林

使用RandomForestClassifier进行分类。

python
from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier(random_state=42)
rf.fit(X_train, y_train)

4.3.2 训练梯度提升树

使用GradientBoostingClassifier进行分类。

python
from sklearn.ensemble import GradientBoostingClassifier
gb = GradientBoostingClassifier(random_state=42)
gb.fit(X_train, y_train)

4.4 朴素贝叶斯

朴素贝叶斯是一种基于概率的分类器。

4.4.1 训练朴素贝叶斯

使用MultinomialNB进行分类。

python
from sklearn.naive_bayes import MultinomialNB
nb = MultinomialNB()
nb.fit(X_train, y_train)

4.5 本章小结

本章介绍了多种分类算法,包括决策树、SVM、随机森林、梯度提升树和朴素贝叶斯。这些算法各有特点,适用于不同的分类场景。