跳到主要内容

泰坦尼克数据集使用文档

组件名称泰坦尼克数据集
工具集数据读写/常用数据集
组件作者雪浪云-墨文
文档版本1.0
功能用于获取通用数据集-泰坦尼克数据集
镜像名称ml_components:3
开发语言Python

组件原理

使用该组件实现将泰坦尼克数据集下发给后续组件使用

  • 输出泰坦尼克号乘客的数据,适用于分类算法,预测乘客是否幸存
  • 数据描述
    • sex:乘客的性别
    • age:乘客的年龄
    • parch:与乘客同行的父母和子女的数量
    • sibsp:与乘客同行的兄弟姐妹和配偶的数量
    • familysize:与乘客同行的家庭成员的总数量
    • title:乘客的称谓(如先生、女士等)
    • pclass:乘客所持船票的等级
    • cabin:乘客所在的船舱
    • fare:乘客所持船票的价格
    • embark:乘客登船的港口

输入桩

输出桩

支持单个csv文件输出。

输出端子1

  • 端口名称: 数据
  • 输出类型: Csv文件
  • 功能描述: 输出泰坦尼克数据集

参数配置

输出结果

  • 功能描述: 查看结果数据
  • 必选参数: 是
  • 默认值: 无

使用方法

  • 将组件拖入到项目中
  • 与后一个组件输入的端口连接(必须是csv类型)
  • 组件输入不需要连接其他节点
  • 点击运行该节点