跳到主要内容

Z-Score标准化

介绍

Z-Score标准化组件是通用的算法组件,用于对输入的数据进行Z-Score标准化转换。

  • 组件会按照右面板设定的方式,定期加载数据库中的历史数据进行模型训练,并保存、更新模型(目前支持Postgresql中的数据)
  • 当组件内模型不存在,且历史数据、时间没达到训练的要求时,组件直接输出接收到的数据
  • 组件重启后,会自动加载上次运行时训练好的模型,对数据进行转换。

输入

  • JSON格式数据,支持的格式如下:
    • 形如:{"a": 1, "b":2}的数据
    • 形如:[{"a": 1, "b":2}, {"a": 2, "b":4}]的数据

输出

  • JSON格式数据:形如:[{"a": 1, "b":2}, {"a": 2, "b":4}]的数据

参数

  • Postgresql地址:Postgresql的服务器地址
  • Postgresql端口:Postgresql的服务器端口,默认5432
  • Postgresql用户:登录Postgresql的用户名
  • Postgresql密码:登录Postgresql的用户名对应密码
  • Postgresql数据库:登录Postgresql的数据库名称
  • Postgresql数据表:用来读取历史数据的表名称
  • 时间列:表中代表时间的列的名称
  • 目标列:需要进行转换的列的名称,用英文逗号分隔
  • 训练触发方式:触发模型训练的方式
    • 达到一定数据触发
    • 定时触发
  • 触发数据条数:触发训练需要达到的数据条数,仅在训练触发方式为"达到一定数据触发"时出现
  • 触发间隔:触发训练需要达到的时间间隔,仅在训练触发方式为"定时触发"时出现
  • 数据读取策略:读取历史数据的策略
    • 读取所有数据:读取所有符合条件的历史数据
    • 按一定间隔读取数据:从符合条件的历史数据中,按照一定间隔抽取数据(一般在历史数据量较大时使用)
  • 数据读取间隔:抽取历史数据时的间隔条数,仅当数据读取策略为"按一定间隔读取数据"时出现

算法参考

https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.StandardScaler.html#sklearn.preprocessing.StandardScaler