Appearance
第4章:分类算法
本章将详细介绍scikit-learn中常用的分类算法及其应用。
4.1 决策树分类器
决策树是一种直观的分类方法。
4.1.1 训练决策树
使用DecisionTreeClassifier进行分类。
python
from sklearn.tree import DecisionTreeClassifier
clf = DecisionTreeClassifier(random_state=42)
clf.fit(X_train, y_train)4.2 支持向量机
支持向量机(SVM)是一种强大的分类器。
4.2.1 训练SVM
使用SVC进行分类。
python
from sklearn.svm import SVC
svm = SVC(random_state=42)
svm.fit(X_train, y_train)4.3 随机森林和梯度提升树
随机森林和梯度提升树是集成学习方法。
4.3.1 训练随机森林
使用RandomForestClassifier进行分类。
python
from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier(random_state=42)
rf.fit(X_train, y_train)4.3.2 训练梯度提升树
使用GradientBoostingClassifier进行分类。
python
from sklearn.ensemble import GradientBoostingClassifier
gb = GradientBoostingClassifier(random_state=42)
gb.fit(X_train, y_train)4.4 朴素贝叶斯
朴素贝叶斯是一种基于概率的分类器。
4.4.1 训练朴素贝叶斯
使用MultinomialNB进行分类。
python
from sklearn.naive_bayes import MultinomialNB
nb = MultinomialNB()
nb.fit(X_train, y_train)4.5 本章小结
本章介绍了多种分类算法,包括决策树、SVM、随机森林、梯度提升树和朴素贝叶斯。这些算法各有特点,适用于不同的分类场景。
