跳到主要内容

多分类评估(MultiClass)使用文档

组件名称多分类评估(MultiClass)
工具集机器学习/算法设计/机器学习/评估/多分类评估(MultiClass)
组件作者雪浪云-燕青
文档版本1.0
功能多分类评估(MultiClass)算法
镜像名称ml_components:3
开发语言Python

组件原理

多分类评估是指基于分类模型的预测结果和原始结果,评估多分类算法模型的优劣性,从而输出评估指标(例如Accuracy、Kappa及F1-Score。

在机器学习任务中,为了较为全面地评价一个分类模型classifier的性能好坏,并且方便地比较不同classifier之间的优劣,我们总是希望通过使用特定的评判指标metrics来为classifer给出一个直观又准确的评分。

对于类别较少的分类问题,如二分类、三分类来说,accuracy是一个比较常用且有效的评判指标;如果要更全面地研究模型的性能,引入f1-score来综合考虑模型的precision和recall能力;甚至是细致地研究其中每一个类别的precision、recall指标等都是比较容易实现的。

然而,对于非常多类别的(如我用到的数据集是500+类)分类任务,想要细致地比较不同的classifer在每个具体类别上的效果是非常困难的,因为通常而言一个模型会在某一些类别上表现良好,而在另一些类别上另一个模型又会有更好的表现,很难综合评价模型的性能;另一方面,使用简单的单个数值的评价指标如accuracy等会因为数据集中严重的类别不均衡问题(在超过100类的真实数据集中大多都有严重的类别不均衡)而具有严重的偏见性。

输入桩

支持单个csv文件输入。

输入端子1

  • 端口名称:预测后数据
  • 输入类型:Csv文件
  • 功能描述: 输入预测后的数据

输出桩

支持json文件输出。

输出端子1

  • 端口名称:评估结果
  • 输出类型:json文件
  • 功能描述: 输出评估的结果

参数配置

评估指标

  • 功能描述:选择多分类评估的指标,有以下指标可以选择:f1_score、accuracy_score、precision_score、recall_score、hamming_loss、zero_one_loss、jaccard_score
  • 必选参数:是
  • 默认值:f1_score

标签列

  • 功能描述:标签列
  • 必选参数:是
  • 默认值:(无)

预测列

  • 功能描述:预测列
  • 必选参数:是
  • 默认值:(无)

使用方法

  • 将组件拖入到项目中
  • 与前一个组件输出的端口连接(必须是csv类型)
  • 点击运行该节点

测试用例

  • 模板

  • 右面板配置

  • 查看结果