成年人收入数据集使用文档
| 组件名称 | 成年人收入数据集 | ||
|---|---|---|---|
| 工具集 | 数据读写/常用数据集 | ||
| 组件作者 | 雪浪云-墨文 | ||
| 文档版本 | 1.0 | ||
| 功能 | 用于获取通用数据集-成年人收入数据集 | ||
| 镜像名称 | ml_components:3 | ||
| 开发语言 | Python | 
组件原理
使用该组件实现将成年人收入数据集下发给后续组件使用
- 输出成年人收入数据,从1994年的人口普查库中提取,主要包含了当时美国居民的基本信息以及对应的年收入
 - 数据描述
- age:每个样本的工作年龄
 - workclass:工作性质,这里有私人的、当地政府等
 - fnlwgt:是在一个州内,dataset的一个观测代表的人数
 - education:每个样本的教育程度
 - marital_status:每个样本的婚姻状况,包括未婚、已婚
 - occupation:表示每个样本从事的职业
 - relationship:每个样本的家庭成员
 - race:样本的种族,有黑人和白人
 - gender:样本的性别
 - capital_gain:样本的税收
 - capital_loss:样本的资本损失
 - hours_per_week:样本每周工作时长
 - native_country:表示样本来自哪个国家
 - income:样本的收入,这里的收入有大于50K和小于等于50K
 
 
输入桩
无
输出桩
支持单个csv文件输出。
输出端子1
- 端口名称: 数据
 - 输出类型: Csv文件
 - 功能描述: 输出成年人收入数据集
 
参数配置
输出结果
- 功能描述: 查看结果数据
 - 必选参数: 是
 - 默认值: 无
 
使用方法
- 将组件拖入到项目中
 - 与后一个组件输入的端口连接(必须是csv类型)
 - 组件输入不需要连接其他节点
 - 点击运行该节点
 

