您现在的位置:首页 > 教案格式 > 正文

主成分分析_成份分析_主成分分析的主要步骤(8)

2016-11-26 11:08 网络整理 教案网

前两个主成份解释了93.4%的方差,按照缺省的选择因子个数的准则MINEIGEN,取大于1的特征值,所以取两个因子。因子模式阵(factorpattern,或称因子载荷阵)为最重要的结果之一:

                                 Factor Pattern                              
                                     FACTOR1   FACTOR2                       
       
                          POP        0.58096   0.80642                       
       
                          SCHOOL     0.76704  -0.54476                       
       
                          EMPLOY     0.67243   0.72605                       
       
                          SERVICES   0.93239  -0.10431                       
       
                          HOUSE      0.79116  -0.55818                       
       

它们是用公因子预报原始变量的回归系数。第一主成份(因子)在所有五个变量上都有正的载荷,可见这个因子反应了城市规模的影响。第二主成份在人口、就业上有大的正载荷,在教育程度和住房价格上有大的负载荷,则第二个因子较大的城市人口多但是教育程度和住房价格低。结果还给出了公因子解释能力的估计:

                 Final Communality Estimates: Total = 4.669974    
                      POP    SCHOOL    EMPLOY  SERVICES     HOUSE  

                 0.987826  0.885106  0.979306  0.880236  0.937500  

这里给出了公因子对每一个原始变量的解释能力的量度,这是用原始变量对公因子的复相关系数平方(取0到1间值)来计算的。CommunalityEstimate是这些复相关系数平方的总和。因为每一个复相关系数平方都比较大,所以我们可以认为两个公因子可以很好地解释原始变量中的信息。但是我们得到的因子解释不够清楚,于是考虑用其它的因子分析方法。

我们来进行主因子分析。用FACTOR过程作主因子分析与作主成份分析的不同只是增加一个PRIORS=选项,可以用PRIORS=SMC或者MAX、ONE等。例如:

PROC FACTOR DATA=SOCECON priors=smc;
   TITLE2 '主因子分析';
RUN;

主因子法计算简约了的相关阵的特征值(相当于的估计),所以其特征值可能为负值。选取因子个数的缺省准则是PROPORTION=1,即累计特征值达到特征值总和的100%。这样取了两个因子。结果与主成份分析相似。为了得到好的因子解释,我们在上面的PROCFACTOR语句中再加上一个ROTATE=PROMAX旋转选项,这样将在得到主因子分析后先产生方差最大正交预旋转(VARIMAX )然后进行斜交旋转,并加了一个REORDER选项使输出时把原始变量受相同因子影响的放在一起: