成年人收入数据集使用文档
组件名称 | 成年人收入数据集 | ||
---|---|---|---|
工具集 | 数据读写/常用数据集 | ||
组件作者 | 雪浪云-墨文 | ||
文档版本 | 1.0 | ||
功能 | 用于获取通用数据集-成年人收入数据集 | ||
镜像名称 | ml_components:3 | ||
开发语言 | Python |
组件原理
使用该组件实现将成年人收入数据集下发给后续组件使用
- 输出成年人收入数据,从1994年的人口普查库中提取,主要包含了当时美国居民的基本信息以及对应的年收入
- 数据描述
- age:每个样本的工作年龄
- workclass:工作性质,这里有私人的、当地政府等
- fnlwgt:是在一个州内,dataset的一个观测代表的人数
- education:每个样本的教育程度
- marital_status:每个样本的婚姻状况,包括未婚、已婚
- occupation:表示每个样本从事的职业
- relationship:每个样本的家庭成员
- race:样本的种族,有黑人和白人
- gender:样本的性别
- capital_gain:样本的税收
- capital_loss:样本的资本损失
- hours_per_week:样本每周工作时长
- native_country:表示样本来自哪个国家
- income:样本的收入,这里的收入有大于50K和小于等于50K
输入桩
无
输出桩
支持单个csv文件输出。
输出端子1
- 端口名称: 数据
- 输出类型: Csv文件
- 功能描述: 输出成年人收入数据集
参数配置
输出结果
- 功能描述: 查看结果数据
- 必选参数: 是
- 默认值: 无
使用方法
- 将组件拖入到项目中
- 与后一个组件输入的端口连接(必须是csv类型)
- 组件输入不需要连接其他节点
- 点击运行该节点