spss因子分析(因子分析：概念、应用及SPSS操作)

spss因子分析
点击蓝字关注我?了解更多量化方法

这期推送来聊一聊量化研究中的【因子分析】。

主要内容：
1、因子分析的概念、功能和应用
2、如何判断因子分析是否适用
3、因子分析的SPSS操作方法

1
因子分析的概念、功能和应用

什么是因子分析？这是一种主要用来浓缩数据的处理方式。它可以通过研究变量之间的内部依赖关系，探求观测数据中的基本结构，在此基础上用少数几个假想变量来表示基本的数据结构，这些假想变量就是因子（factors）。因子分析就是研究怎样以最少的信息丢失为代价，把众多的观测变量浓缩为少数几个因子。
举个例子：中学时，测量学生的学习能力，我们通常使用很多个学科的成绩来描述（语文、数学、英语等等）。而如果这些可观测变量能够缩减为三个能力的变量（言语能力、想象能力、抽象思维能力），就可以更加简单明了地表示学生的学习能力。这就是因子分析能够帮我们做到的。

因子分析主要有以下两个功能：
（1）寻求基本结构（summarization），也就是通过对数据的分析，找到几个较少的、而又能反映信息本质特征的因子，来描述数据的基本结构。
比如，一家快餐店为了了解自己的市场竞争能力，设计了30个调查项目，而这30个调查项目可以反映快餐的质量、价格、就餐环境和服务四个基本方面，通过因子分析就可以找到这四个因子。
（2）数据化简（data reduction）。在将变量化为少数几个因子之后，再利用因子代替原来的变量进行统计分析，可以达到数据化简的目的。
本文重点介绍的是探索性（exploratory）因子分析，因子分析的大部分应用数据这种类型；暂不讨论心理学领域中较为常用的验证性（confirmatory）因子分析。

因子分析的模型和多元回归的模型十分相似，在进行因子分析时主要包括以下四个步骤：
（1）计算所有变量的相关矩阵，根据相关矩阵判断是不是适合应用因子分析方法。
（2）提取因子，确定因子个数和求因子解的方法。
（3）因子旋转，目的是通过坐标变换使因子解的实际意义更容易解释。
（4）计算因子值，以便在其他分析中使用这些因子。

最后来讲讲探索性因子分析的应用。
前面的推文中和大家提到过问卷分析中两个非常重要的概念——信度和效度。信度主要通过可靠性检验（计算克隆巴赫α的值）来进行，效度则可以通过今天介绍的因子分析法来检验。
另一个应用是结果处理，针对每个因子选择有代表性的变量进行后续研究，可以有效地减少后续分析的工作量。

2
如何判断因子分析法是否适用？

在进行实际操作之前，我们必须先了解这样一个情况：我当前的数据能使用因子分析法进行处理吗？

以什么标准来进行这样的判断呢？SPSS中提供了以下几个帮助我们进行判断的统计量：
（1）变量间相关矩阵。如果所有或大部分相关小于0.3，则不适合做因子分析。
（2）反映像相关矩阵（anti-image correlation matrix）。如果矩阵中变量之间的偏相关系数很小，可能比较适合做因子分析。
（3）Bartlett球形检验。显著性小于0.05（即显著拒绝原假设）时才能进行因子分析。
（4）KMO测度：0.9以上为非常好，0.8为好，0.7为一般，0.6为差，0.5为很差，0.5以下则不能进行因子分析。

那么这些检验要怎么进行呢？接下来我将用CGSS上的2015年网民社会意识调查问卷来讲解一下如何进行SPSS操作。
展示中，我选择的题目是问卷中的question 21，一共11个选项，包括“不管我们国家是不是富裕，我们都应该向贫穷国家提供国际援助”等涉及社会意识的题目。

为了用更少的变量理解原本题目想要探究的内容，我们要对这个题目进行因子分析。首先，样本量为3781份，且样本量与变量之比大于10：1，样本量较为合适。

点击分析——降维——因子

将所有11个选项放入“变量”中

点击“描述”，在“相关性矩阵”下面选择系数、显著性水平、反映像、KMO和巴特利特球形度检验，点击“继续”

点击“提取”，在“方法”中选择“主轴因式分解”，点击“确定”

结果如下所示：
首先是一个硕大无比的相关性矩阵。因为矩阵中大部分相关大于0.3，说明可以做因子分析。

在接下来的KMO和Bartlett球形检验中，KMO的值为0.863，Bartlett球形检验结果显著，满足进行因子分析的前提。

反映像相关矩阵的对角线上都大于0.5，同样满足前提假设。

3
如何用SPSS进行因子分析？

通过上述检验，我们可以看到当前的示范数据是非常适合进行因子分析的。那么问题来了——怎么确定要将变量分为多少个公因子呢？
实际操作中，我们常常会借助以下几个准则：
（1）特征值准则：将特征值大于等于1的主成分作为引子，放弃小于1的主成分。
（2）碎石检验准则：按照因子提取顺序画出因子的特征值随因子个数变化的散点图。曲线开始变平的前一个点作为提取的最大因子数。后面的散点就像山脚下的碎石，舍去“碎石”并不会损失很多信息。

在SPSS操作中，可以通过以下方法完成：
依然选择分析——降维——因子，将11个选项放入“变量”中。在“提取”中“展示”下面勾选碎石图，点击确定。
首先从“总方差解释”中可以看到，三个特征根大于1的因子共解释了总方差的47.906%。

碎石图如下：

结合碎石图和特征根大于1的标准，尝试抽取3个因子。再进入下一步操作：
依然选择分析——降维——因子，将11个选项放入“变量”中。在“提取”中选择“固定因子数目”，输入3。

点击“选项”，勾选“禁止显示小系数”，绝对值输入0.3

点击“选择”，在“方法”处勾选“直接斜交法”。

点击确定查看结果：
从“因子矩阵”中可以看出，三个因子均存在因子载荷大于0.3的变量，说明选择三个因子是合适的；因为有很多变量存在交叉载荷，继续看下方的“模式矩阵”。

可以看到，斜交旋转后的大部分变量都只在一个因子上有较高的载荷，而且绝对值都在0.3以上；如果存在因子载荷值特别低的题目，可以考虑将对应题目删除。
根据每个因子下面题目的意义，我们就可以对因子进行命名了。比如在这个案例中，我可以姑且将因子1命名为“传统价值观”，因子2为“现代价值观”，因子3为“民族主义”。这样，我们就完成了对11个变量的因子分析，将其简化为了三个可以代表变量基本结构的因子。

以上就是因子分析的详细操作啦！你学会了吗？
如果你还想学习更多量化研究方法，记得持续关注我哦！如果你有特别的量化研究问题，也可以考虑移步我的同名知乎平台Mior芈奥进行付费咨询哟~ 我们下期再见！

Mior芈奥专注量化研究的传播学硕士 | 分享读书与旅行的心得 39篇原创内容 –> 公众号 *本文的写作参考郭志刚《社会统计分析方法》、刘红云《高级心理统计》

芭蕉树常识网

spss因子分析(因子分析：概念、应用及SPSS操作)

spss因子分析相关文章

您可能感兴趣