跳到主要内容

算盘入门第三篇-机器学习频道

机器学习频道提供了一系列机器学习模型,为算盘提供了通过机器学习算法进行预测的问题。机器学习频道常用于分类预测,回归预测,聚类等操作。并提供可视化方法查看预测结果。这里,我们通过两个案例介绍机器学习频道的使用方法。

一、机器学习频道模板开发教学

本次演示的是通过 xgboost 算法对波士顿房价数据集进行回归,然后使用折线图方式对预测结果进行可视化。

  1. 在机器学习模板里新建一个空白项目。在内置组件里输入“波士顿”,拖拽出波士顿数据集。点击运行 → 运行该节点可以对数据结果进行预览。
  2. 输入“拆分”,选择算法组件数据预处理模块中的数据拆分组件,点击运行,预览结果。
  3. 拖出 xgboost 回归组件,在参数设置界面更改超参数,在字段设置里配置特征字段与标识字段。其中最后一个字段为标识字段,其他为特征字段。
  4. 输入“预测模型”,拖出模块,并进行连线和字段设置配置。点击运行,得到结果。
  5. 输入“折线图”,拖出模块,在“字段设置”“X轴字段”选择“AGE”,在“字段设置”“X轴字段”选择“MEDV,prediction”,点击运行,即可查看可视化数据,查看不同年龄下预测结果和真实标签。
  6. 最后,以上都是逐个模型运行的,在配置完参数后也可以通过运行到此处/从此节点开始运行直接运行模板。我们拖出一个csv,上传本地的波士顿房价数据,点击从此节点开始运行即可直接运行模板。

二、机器学习模型在应用开发中部署与使用的进阶教学

基于上述的教程完成机器学习模型发布,并在应用开发模块使用发布的机器学习进行预测。

  1. 在机器学习模板里打开教程1中的模块。
  2. 输入“模型发布”,拖出“回归模型发布”组件。在参数设置中选择“评估指标”为“均方误差”,“阈值”为“100”,评判标准为“<=”,在模型名称里输入“xgboost模型发布”。
  3. 在字段设置里配置特征列和标签列,其中最后一个为标签列,前面的均为特征列。
  4. 点击运行到此处,成功运行即成功发布机器学习模型。
  5. 打开一个空的应用开发项目。
  6. 编辑前面板,分别拖出“按钮”和“json显示”组件。
  7. 回到后面板,在“我的组件”里搜索“xgboost模型发布”,并拖拽出来。
  8. 搜索并拖出“csv上传”,“数据转换(Csv2Json)”,“模型预测(Csv)”组件,并进行连线。
  9. 将“模型预测(Csv)”组件的特征字段设置成“CRIM,ZN,INDUS,CHAS,NOX,RM,AGE,DIS,RAD,TAX,PTRATIO,B,LSTAT”,预测字段输入“prediction"。
  10. 点击运行 → 调试,上传csv数据。
  11. 打开前面板,点击按钮即可得到最终预测的结果。