主成分分析
组件作者 | 燕青 | 组件ID | 12507 |
---|---|---|---|
功能 | 适用于使用历史数据进行PCA模型训练,流计算数据使用模型进行降维分析 | ||
输入桩格式 | 输入类型:json | ||
输出桩格式 | 输入类型:json | ||
其他 | 将没有在区间内的数据转换为None |
输入
输入为json
例:
[
{
"sepal_length":1,
"sepal_width":1,
"petal_length":1,
"petal_width":1
}
]
输出_
输出json
例:
[
{
"pca_0":1,
"pca_1":1
}
]
参数配置
- Postgresql地址
- Postgresql端口
- Postgresql用户
- Postgresql密码
- Postgresql数据库
- Postgresql数据表
- 时间列
- 目标列
- 训练触发方式
两种:一种为定时触发,一种为达到一定数据量触发
- 数据读取策略
读取所有数据或读取一定间隔数据
- 主成分个数
要保存的主成分数量。
- whiten(白化:使每个特征具有相同的方差)
当为真(默认为假)时,components_向量乘以n_samples的平方根,然后除以奇异值,以确保输出与单位分量方差不相关。
- SVD求解器
可以选择‘auto’, ‘full’, ‘arpack’, ‘randomized’
- tol(容忍度)
当svd_solver == arpack时,计算的奇异值的容忍度。
- iterated_power(幂次法迭代次数)
当svd_solver==random时,计算的幂次法的迭代次数。
- random_state
当svd_solver == arpack或randomized时使用。在多个函数调用中传递可重复的结果。
- 输出列名
默认输出为pca_0,pca_1...,len(输出列名)==主成分个数。
参考文档
https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html