跳到主要内容

Nu支持向量机分类(NuSVC)

组件名称Nu支持向量机分类(NuSVC)
工具集机器学习/分类/Nu支持向量机分类(NuSVC)
组件作者雪浪云-燕青
文档版本1.0
功能Nu支持向量机分类(NuSVC)算法
镜像名称ml_components:3
开发语言Python

组件原理

Nu支持向量机分类是机器学习中的一种分类组件。

在机器学习中,支持向量机(SVMs,也称为支持向量网络)是一种有关联学习算法的监督学习模型,支持分类和回归问题的数据建模。给定一组训练数据,每个样本属于一个或其他类别,用支持向量机算法构建并训练一个模型,将新样本分配到一个类别,使它成为一个非概率性二分类器。支持向量机模型是将样本表示为空间中的点,并将其映射,以便将不同类别的样本之间的间距尽可能大。然后,新的样本被映射到相同的空间中,并根据它们所处的位置,预测它们属于某个类别。

除了执行线性分类,支持向量机还可以通过使用核线方程有效地执行非线性分类,隐式地将它们的输入映射到高维特征空间。

当数据没有标记时,监督学习是不可能的,需要一种无监督学习方法,通过无监督学习试图找到数据到类别的自然聚类,然后将新数据映射到这些形成的类别。支持向量聚类算法是由Hava Siegelmann和Vladimir Vapnik共同创建的,它利用支持向量的统计量对未标注的数据进行分类,是工业应用中应用最广泛的聚类算法之一。

支持向量机分类有两个常用的版本,“epsilon-SVR”和“nu-SVR”。原始的SVM分类公式(SVR)使用参数C [0, inf]和epsilon[0, inf)对没有正确预测的点进行优化,从而产生惩罚。后来开发了两种SVM分类的替代版本,其中惩罚参数epsilon被另一个替代参数nu[0,1]所替代,该替代参数的惩罚略有不同。支持向量机nu版本的主要动机是它有一个更有意义的解释。这是因为nu表示训练样本中误差部分的上界和支持向量部分的下界。有些用户觉得nu比C或更直观。nu-SVM和C-SVM只是惩罚参数的不同版本。这两种情况都解决了相同的优化问题。

组件

  • 组件图

输入桩

支持单个csv文件输入。

输入端子1

  • 端口名称:训练数据
  • 输入类型:Csv文件
  • 功能描述: 输入用于训练的数据

输出桩

支持sklearn模型输出。

输出端子1

  • 端口名称:输出模型
  • 输出类型:sklearn模型
  • 功能描述: 输出训练好的模型用于预测

参数配置

nu

  • 功能描述:训练误差分数的上界和支持向量分数的下界。
  • 必选参数:是
  • 默认值:0.5

kernel

  • 功能描述:指定要在算法中使用的内核类型。‘linear’, ‘poly’, ‘rbf’, ‘sigmoid’, ‘precomputed’中的一种。
  • 必选参数:是
  • 默认值:rbf

degree

  • 功能描述:多项式核函数的次数(' poly ')。
  • 必选参数:是
  • 默认值:3

grmma

  • 功能描述:' rbf ', ' poly '和' sigmoid '的核系数
  • 必选参数:是
  • 默认值:auto

coef0

  • 功能描述:核函数中的独立项。
  • 必选参数:是
  • 默认值:0

shrinking

  • 功能描述:是否使用收缩启发式。
  • 必选参数:是
  • 默认值:true

tol

  • 功能描述:early stop的容忍度。
  • 必选参数:是
  • 默认值:0.001

Cache Size

  • 功能描述:指定内核缓存的大小(以MB为单位)。
  • 必选参数:是
  • 默认值:200

verbose

  • 功能描述:是否输出详细信息。
  • 必选参数:是
  • 默认值:false

Max Iter

  • 功能描述:要运行的最大迭代数。
  • 必选参数:是
  • 默认值:1000

Random State

  • 功能描述:随机种子
  • 必选参数:否
  • 默认值:(无)

Decision Fcuntion Shape

  • 功能描述:决策函数返回数据形状,‘ovr’或‘ovo’
  • 必选参数:是
  • 默认值:ovr

需要训练

  • 功能描述:该模型是否需要训练,默认为需要训练。
  • 必选参数:是
  • 默认值:true

特征字段

  • 功能描述:特征字段
  • 必选参数:是
  • 默认值:(无)

识别字段

  • 功能描述:识别字段
  • 必选参数:是
  • 默认值:(无)

使用方法

  • 将组件拖入到项目中
  • 与前一个组件输出的端口连接(必须是csv类型)
  • 点击运行该节点

测试用例

模板

右面板配置

  • 参数设置:

  • 字段设置:

输入的数据:

输出的结果:

  • 输出模型: