跳到主要内容

分位数变换(QuantileTransformer)

组件名称分位数变换(QuantileTransformer)
工具集机器学习/特征/特征转换/分位数变换(QuantileTransformer)
组件作者雪浪云-燕青
文档版本1.0
功能分位数变换(QuantileTransformer)算法
镜像名称ml_components:3
开发语言Python

组件原理

使用分位数信息转换特征。

该方法将特征变换为均匀分布或正态分布。因此,对于给定的特性,这种转换倾向于分散最频繁的值,它还减少了(边缘)异常值的影响。

该转换独立地应用于每个特性。首先,对特征的累积分布函数进行估计,将原始值映射到均匀分布。然后,使用关联的分位数函数将所获得的值映射到所需的输出分布。低于或高于拟合范围的新的特征值将映射到输出分布的边界。请注意,此转换是非线性的。它可能扭曲在同一标度下测量的变量之间的线性相关性,但使在不同尺度上测量的变量更直接地具有可比性。

组件

  • 组件图

输入桩

支持单个csv文件输入。

输入端子1

  • 端口名称: 训练数据
  • 输出类型: Csv文件
  • 功能描述: 输入用于训练的数据

输出桩

支持Csv文件输出。

输出端子1

  • 端口名称: 输出数据
  • 输出类型: Csv文件
  • 功能描述: 输出处理后的结果数据

输出端子2

  • 端口名称: 输出模型
  • 输出类型: sklearn文件
  • 功能描述: 输出训练后的模型

参数配置

分位数个数

  • 功能描述: 需要进行计算的分位数总数
  • 必选参数:
  • 默认值: 100

输出分布

  • 功能描述: 输出分布
  • 必选参数:
  • 默认值: uniform

最大样本个数

  • 功能描述: 用于估计分位数的最大样本数,用以提高计算效率
  • 必选参数:
  • 默认值: 10000

Random State

  • 功能描述: 随机种子
  • 必选参数:
  • 默认值: (无)

目标字段

  • 功能描述: 目标字段
  • 必选参数:
  • 默认值: (无)

使用方法

  • 加组件拖入到项目中
  • 与前一个组件输出的端口连接(必须是csv类型)
  • 点击运行该节点

测试用例

模板

右面板配置

  • 参数设置:

  • 字段设置:

输入的数据:

输出的结果:

  • 输出数据:

  • 输出模型: