跳到主要内容

成年人收入数据集使用文档

组件名称成年人收入数据集
工具集数据读写/常用数据集
组件作者雪浪云-墨文
文档版本1.0
功能用于获取通用数据集-成年人收入数据集
镜像名称ml_components:3
开发语言Python

组件原理

使用该组件实现将成年人收入数据集下发给后续组件使用

  • 输出成年人收入数据,从1994年的人口普查库中提取,主要包含了当时美国居民的基本信息以及对应的年收入
  • 数据描述
    • age:每个样本的工作年龄
    • workclass:工作性质,这里有私人的、当地政府等
    • fnlwgt:是在一个州内,dataset的一个观测代表的人数
    • education:每个样本的教育程度
    • marital_status:每个样本的婚姻状况,包括未婚、已婚
    • occupation:表示每个样本从事的职业
    • relationship:每个样本的家庭成员
    • race:样本的种族,有黑人和白人
    • gender:样本的性别
    • capital_gain:样本的税收
    • capital_loss:样本的资本损失
    • hours_per_week:样本每周工作时长
    • native_country:表示样本来自哪个国家
    • income:样本的收入,这里的收入有大于50K和小于等于50K

输入桩

输出桩

支持单个csv文件输出。

输出端子1

  • 端口名称: 数据
  • 输出类型: Csv文件
  • 功能描述: 输出成年人收入数据集

参数配置

输出结果

  • 功能描述: 查看结果数据
  • 必选参数: 是
  • 默认值: 无

使用方法

  • 将组件拖入到项目中
  • 与后一个组件输入的端口连接(必须是csv类型)
  • 组件输入不需要连接其他节点
  • 点击运行该节点