跳到主要内容

支持向量机案例二 例6.3

image.png 机器学习6.3.zip

  1. 进入算盘-应用开发,点击导入-选择下载好的流程包完成导入。

image.png

  1. 进入项目,点击运行-调试,等待项目开始运行。
  2. 选中机器学习组件,在参数设置面板中,点击配置-新窗口打开。
  3. 在组件列表-数据集中拖出文件上传,在参数设置面板中,上传iris数据集。

data.csv

  1. 在组件列表-数据预处理中拖出拆分训练集,在参数设置面板中设置训练集比例为0.7,用于构建分类器模型,其余数据将用作待预测数据。

image.png

  1. 在组件列表-算法模型-分类中拖出支持向量分类,在参数设置面板中设置特征字段为“sepal_length,sepal_width,petal_length,petal_width”,设置标签字段为“class”,设置核为“linear”,最大迭代次数为1。

image.png image.png

  1. 在组件列表-算法模型-分类中拖出支持向量分类,在参数设置面板中设置特征字段为“sepal_length,sepal_width,petal_length,petal_width”,设置标签字段为“class”,设置核为“rbf”,最大迭代次数为1。

image.png image.png

  1. 在组件列表-算法模型-分类中拖出决策树分类,在参数设置面板中设置特征字段为“sepal_length,sepal_width,petal_length,petal_width”,设置标签字段为“class”,设置分裂准则为“entropy”,最大树深度为10,分裂最小样本数为2,叶节点最小样本数为1,叶节点最小权重和为0.0000001,最大叶节点数为2,最小不纯度下降量为1,以实现C4.5算法。

C4.5算法是ID3算法的延伸,C4.5算法对ID3算法主要做了一下几点改进: image.pngimage.pngimage.png (1)通过信息增益率选择分裂属性,克服了ID3算法中通过信息增益倾向于选择拥有多个属性值的属性作为分
裂属性的不足;
(2)能够处理离散型和连续型的属性类型,即将连续型的属性进行离散化处理;
(3)构造决策树之后进行剪枝操作;
(4)能够处理具有缺失属性值的训练数据。

  1. 在组件列表-模型评估中拖出三个二分类模型评估,设置评估指标数值输出为“accuracy_score”,设置标签字段为“class”,预测字段为“prediction”。

  2. 各组件接线如下图所示

image.png

  1. 点击部署。分别右键点击三个二分类模型评估,单击查看评估结果(数值)即可查看评估结果。image.pngimage.pngimage.png