跳到主要内容

随机生成回归数据集使用文档

组件名称随机生成回归数据集
工具集数据读写
组件作者雪浪云-墨文
文档版本1.0
功能随机生成回归数据集
镜像名称ml_components:3
开发语言Python

组件原理

这个组件可以随机生成回归数据集

输入桩

该组件没有输入

输出桩

支持Csv文件输出。

输出端子1

  • 端口名称: 输出数据
  • 输出类型: Csv文件
  • 功能描述: 输出生成的数据集

参数配置

总样本数

  • 功能描述: 生成数据的总样本数
  • 必选参数:
  • 默认值: 100

特征数

  • 功能描述: 生成数据的特征数
  • 必选参数:
  • 默认值: 20

信息特征数

  • 功能描述: 生成数据的信息特征数
  • 必选参数:
  • 默认值: 10

标签数

  • 功能描述: 生成数据的标签数
  • 必选参数:
  • 默认值: 1

偏差

  • 功能描述: 生成数据的偏差
  • 必选参数:
  • 默认值: (无)

Effective Rank

  • 功能描述: 生成数据的有效秩
  • 必选参数:
  • 默认值: (无)

Tail Strength

  • 功能描述: 生成数据的尾强度
  • 必选参数:
  • 默认值: 0.5

噪声

  • 功能描述: 生成数据的噪声
  • 必选参数:
  • 默认值: (无)

Shuffle

  • 功能描述: 是否打乱次序
  • 必选参数:
  • 默认值: true

Random State

  • 功能描述: 打乱生成数据
  • 必选参数:
  • 默认值: (无)

使用方法

  • 加组件拖入到项目中
  • 与后一个组件输入的端口连接(必须是csv类型)
  • 组件输入不需要连接其他节点
  • 填写参数
  • 点击运行该节点