跳到主要内容

主成分分析

组件作者燕青组件ID12507
功能适用于使用历史数据进行PCA模型训练,流计算数据使用模型进行降维分析
输入桩格式输入类型:json
输出桩格式输入类型:json
其他将没有在区间内的数据转换为None

输入

输入为json
例:

[
{
"sepal_length":1,
"sepal_width":1,
"petal_length":1,
"petal_width":1
}
]

输出_

输出json
例:

[
{
"pca_0":1,
"pca_1":1
}
]

参数配置

  • Postgresql地址
  • Postgresql端口
  • Postgresql用户
  • Postgresql密码
  • Postgresql数据库
  • Postgresql数据表
  • 时间列
  • 目标列
  • 训练触发方式

两种:一种为定时触发,一种为达到一定数据量触发

  • 数据读取策略

读取所有数据或读取一定间隔数据

  • 主成分个数

要保存的主成分数量。

  • whiten(白化:使每个特征具有相同的方差)

当为真(默认为假)时,components_向量乘以n_samples的平方根,然后除以奇异值,以确保输出与单位分量方差不相关。

  • SVD求解器

可以选择‘auto’, ‘full’, ‘arpack’, ‘randomized’

  • tol(容忍度)

当svd_solver == arpack时,计算的奇异值的容忍度。

  • iterated_power(幂次法迭代次数)

当svd_solver==random时,计算的幂次法的迭代次数。

  • random_state

当svd_solver == arpack或randomized时使用。在多个函数调用中传递可重复的结果。

  • 输出列名

默认输出为pca_0,pca_1...,len(输出列名)==主成分个数。

参考文档

https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html