PCA(主成分分析)算法,主要用于数据降维,保留了数据集中对方差贡献最大的若干个特征来达到简化数据集的目的。
实现数据降维的步骤:1、将原始数据中的每一个样本用向量表示,把所有样本组合起来构成一个矩阵,通常需对样本矩阵进行处理,得到中性化样本矩阵2、求样本矩阵的协方差矩阵3、求协方差矩阵的特征值和特征向量4、将求出的特征向量按照特征值的大小进行组合形成一个映射矩阵。
并根据指定的PCA保留的特征个数取出映射矩阵的前n行或者前n列作为最终的映射矩阵。
5、用映射矩阵对数据进行映射,达到数据降维的目的。
2024/1/6 15:32:43
24KB
PCA
1