分位数变换(QuantileTransformer)
| 组件名称 | 分位数变换(QuantileTransformer) | ||
|---|---|---|---|
| 工具集 | 机器学习/特征/特征转换/分位数变换(QuantileTransformer) | ||
| 组件作者 | 雪浪云-燕青 | ||
| 文档版本 | 1.0 | ||
| 功能 | 分位数变换(QuantileTransformer)算法 | ||
| 镜像名称 | ml_components:3 | ||
| 开发语言 | Python |
组件原理
使用分位数信息转换特征。
该方法将特征变换为均匀分布或正态分布。因此,对于给定的特性,这种转换倾向于分散最频繁的值,它还减少了(边缘)异常值的影响。
该转换独立地应用于每个特性。首先,对特征的累积分布函数进行估计,将原始值映射到均匀分布。然后,使用关联的分位数函数将所获得的值映射到所需的输出分布。低于或高于拟合范围的新的特征值将映射到输出分布的边界。请注意,此转换是非线性的。它可能扭曲在同一标度下测量的变量之间的线性相关性,但使在不同尺度上测量的变量更直接地具有可比性。
组件
- 组件图:

输入桩
支持单个csv文件输入。
输入端子1
- 端口名称: 训练数据
- 输出类型: Csv文件
- 功能描述: 输入用于训练的数据
输出桩
支持Csv文件输出。
输出端子1
- 端口名称: 输出数据
- 输出类型: Csv文件
- 功能描述: 输出处理后的结果数据
输出端子2
- 端口名称: 输出模型
- 输出类型: sklearn文件
- 功能描述: 输出训练后的模型
参数配置
分位数个数
- 功能描述: 需要进行计算的分位数总数
- 必选参数: 是
- 默认值: 100
输出分布
- 功能描述: 输出分布
- 必选参数: 是
- 默认值: uniform
最大样本个数
- 功能描述: 用于估计分位数的最大样本数,用以提高计算效率
- 必选参数: 是
- 默认值: 10000
Random State
- 功能描述: 随机种子
- 必选参数: 否
- 默认值: (无)
目标字段
- 功能描述: 目标字段
- 必选参数: 是
- 默认值: (无)
使用方法
- 加组件拖入到项目中
- 与前一个组件输出的端口连接(必须是csv类型)
- 点击运行该节点
测试用例
模板

右面板配置
- 参数设置:

- 字段设置:

输入的数据:

输出的结果:
- 输出数据:

- 输出模型:
