主成分个数的选取原则

如题所述

举报该问题

推荐答案 2023-08-22

主成分个数的选取原则首先需要计算各主成分的方差，再求出各自对应的方差贡献率（即对应主成分方差除以总方差），根据累积贡献率的大小取前面m 个(m<p)主成分，p代表所有的主成分。

主成分分析是最常用的线性降维方法，通过某种线性投影，将高维的数据映射到低维的空间，并期望在所投影的维度上数据的信息量最大（方差最大），以较少的数据维度去反映原数据的特性。

在机器学习的实际问题中，一般都会有几十个指标，高维数据离散度较大，不利于训练出较好的参数，而低维数据则可以更好的训练参数，因此可以通过降维的形式，计算出k列映射数据替代原数据。

主要步骤

1. 求样本均值

2.求样本协方差矩阵S

3.计算协方差矩阵的特征值和特征向量

4.将特征值排序

5.保留前N个最大的特征值对应的特征向量

6.将原始特征转换到上面得到的N个特征向量构建的新空间中

7.写出主成分的表达式

注：第五步和第六步，实现了特征压缩。

主成分分析是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。特征值在某种程度上可以被看成是表示主成分影响力度大小的指标，如果特征值小于1，说明该成分的解释力度还不如直接引入一个原变量的平均解释力度大，因此一般可以用特征值大于1组委纳入标准。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://66.wendadaohang.com/zd/nnxiU99nDipDpD2U2ni.html

相似回答

spss中能否指定主成分分析中主成分的个数!!!答：可以啊。在主成分对话框里面，选择“Extraction”按钮，在Exact区域，有一个选项叫做：Number of factors。参考资料：SPSS统计分析高级教程

主成分分析法答：主成分分析可以得到P个主成分，但是由于各个主成分的方差与其包含的信息量皆是递减的，所以在实际分析时，一般不选取P个主成分，而是根据各个主成分所累计的贡献率的大小来选取前K个主成分，这里的贡献率是指某个主成分的方差在全部方差中所占的比重，实际上也是某个特征值在全部特征值合计中所占的比重。

PCA(主成分分析) 一答：（1）每一个主成分是原始变量的线性组合。（2）主成分的数目少于原始变量的数目。（3）主成分保留了原始变量的大多数变异信息。（4）各主成分间互不相关。假定只有二维，即只有两个变量，由横坐标和纵坐标所代表；每个观测值都有相应于这两个坐标轴的坐标值。如果这些数据形成一个椭圆形状的点阵（这...

请教关于SPSS做主成分分析的问题: 依据特征值大于1提取的有5个主成分...答：这里当然选五个了啊，一般按特征值大于1来选，方差贡献率越大越好，大于80%也不是不选后面的因子了

16种常用的数据分析方法-主成分分析答：1.根据研究问题选取初始分析变量 2.根据初始变量特性判断由协方差阵求主成分还是由相关矩阵求主成分; 3.求协方差阵或相关阵的特征值与相应标准特征向量; 4.判断是否存在明显的多重共线性,若存在,则回到第(1)步; 5.得到主成分的表达式并确定主成分个数,选取主成分; 6.结合主成分对研究问题进行分析并深入研究。

主成分分析与因子分析及SPSS实现答：(2)主成分分析的原理主成分分析的本质是坐标的旋转变换,将原始的n个变量进行重新的线性组合,生成n个新的变量,他们之间互不相关,称为n个“成分”。同时按照方差最大化的原则,保证第一个成分的方差最大,然后依次递减。这n个成分是按照方差从大到小排列的,其中前m个成分可能就包含了原始变量的大部分方差(及变异...

大家正在搜

怎么确定主成分个数简述提取样本主成分的原则主成分分析的原则主成分分析确定主成分个数主成分构造原则主成分的充分必要条件主成分分析f1怎么算出来的主成分选几个主成分分析提取主成分的依据