Python使用Scikit-learnSVM实战
准备工作:
1. 安装Python。可以从官方网站下载并安装最新版本的Python。
2. 安装Scikit-learn。可以使用pip命令(pip install scikit-learn)或者使用Anaconda进行安装(conda install scikit-learn)。
3. 下载数据集。本样例使用的是鸢尾花数据集(iris dataset),可以从以下网址下载:https://archive.ics.uci.edu/ml/datasets/iris
依赖的类库:
1. sklearn.svm.SVC:Scikit-learn中的SVM算法实现类。
2. sklearn.datasets.load_iris:Scikit-learn中的鸢尾花数据集加载函数。
样例数据说明:
鸢尾花数据集包含150个样本,每个样本具有4个特征(萼片长度、萼片宽度、花瓣长度和花瓣宽度),以及它们对应的类别标签(Setosa、Versicolor、Virginica)。
Python代码实现如下:
python
from sklearn import svm
from sklearn.datasets import load_iris
# 导入数据集
iris = load_iris()
# 创建SVM分类器对象
clf = svm.SVC()
# 使用数据集训练SVM模型
clf.fit(iris.data, iris.target)
# 预测新样本的类别
new_sample = [[5.0, 3.6, 1.3, 0.25]]
predicted_class = clf.predict(new_sample)
# 打印预测结果
print("Predicted class:", predicted_class)
程序输出结果:
Predicted class: [0]
总结:
本样例示范了如何使用Scikit-learn中的SVM算法对鸢尾花数据集进行分类。首先,我们需要安装Python和Scikit-learn库,并下载数据集。然后,我们导入必要的类库和数据集,并创建一个SVM分类器对象。接下来,使用数据集训练SVM模型,并利用训练好的模型预测新样本的类别。最后,打印预测结果。
通过这个样例,我们可以看到使用Scikit-learn的SVM算法非常简单且灵活。有了合适的环境搭建和准备工作,我们可以快速使用Scikit-learn中的SVM算法完成实战任务。