您的位置 首页 知识

spss因子分析(因子分析:概念、应用及SPSS操作)

spss因子分析
点击蓝字关注我?了解更多量化方法

这期推送来聊一聊量化研究中的【因子分析】。

主要内容:
1、因子分析的概念、功能和应用
2、如何判断因子分析是否适用
3、因子分析的SPSS操作方法

1
因子分析的概念、功能和应用

什么是因子分析?这是一种主要用来浓缩数据的处理方式。它可以通过研究变量之间的内部依赖关系,探求观测数据中的基本结构,在此基础上用少数几个假想变量来表示基本的数据结构,这些假想变量就是因子(factors)。因子分析就是研究怎样以最少的信息丢失为代价,把众多的观测变量浓缩为少数几个因子。
举个例子:中学时,测量学生的学习能力,我们通常使用很多个学科的成绩来描述(语文、数学、英语等等)。而如果这些可观测变量能够缩减为三个能力的变量(言语能力、想象能力、抽象思维能力),就可以更加简单明了地表示学生的学习能力。这就是因子分析能够帮我们做到的。

因子分析主要有以下两个功能:
(1)寻求基本结构(summarization),也就是通过对数据的分析,找到几个较少的、而又能反映信息本质特征的因子,来描述数据的基本结构。
比如,一家快餐店为了了解自己的市场竞争能力,设计了30个调查项目,而这30个调查项目可以反映快餐的质量、价格、就餐环境和服务四个基本方面,通过因子分析就可以找到这四个因子。
(2)数据化简(data reduction)。在将变量化为少数几个因子之后,再利用因子代替原来的变量进行统计分析,可以达到数据化简的目的。
本文重点介绍的是探索性(exploratory)因子分析,因子分析的大部分应用数据这种类型;暂不讨论心理学领域中较为常用的验证性(confirmatory)因子分析。

因子分析的模型和多元回归的模型十分相似,在进行因子分析时主要包括以下四个步骤:
(1)计算所有变量的相关矩阵,根据相关矩阵判断是不是适合应用因子分析方法。
(2)提取因子,确定因子个数和求因子解的方法。
(3)因子旋转,目的是通过坐标变换使因子解的实际意义更容易解释。
(4)计算因子值,以便在其他分析中使用这些因子。

最后来讲讲探索性因子分析的应用。
前面的推文中和大家提到过问卷分析中两个非常重要的概念——信度和效度。信度主要通过可靠性检验(计算克隆巴赫α的值)来进行,效度则可以通过今天介绍的因子分析法来检验。
另一个应用是结果处理,针对每个因子选择有代表性的变量进行后续研究,可以有效地减少后续分析的工作量。

 
2
如何判断因子分析法是否适用?

在进行实际操作之前,我们必须先了解这样一个情况:我当前的数据能使用因子分析法进行处理吗?

以什么标准来进行这样的判断呢?SPSS中提供了以下几个帮助我们进行判断的统计量:
(1)变量间相关矩阵。如果所有或大部分相关小于0.3,则不适合做因子分析。
(2)反映像相关矩阵(anti-image correlation matrix)。如果矩阵中变量之间的偏相关系数很小,可能比较适合做因子分析。
(3)Bartlett球形检验。显著性小于0.05(即显著拒绝原假设)时才能进行因子分析。
(4)KMO测度:0.9以上为非常好,0.8为好,0.7为一般,0.6为差,0.5为很差,0.5以下则不能进行因子分析。

那么这些检验要怎么进行呢?接下来我将用CGSS上的2015年网民社会意识调查问卷来讲解一下如何进行SPSS操作。
展示中,我选择的题目是问卷中的question 21,一共11个选项,包括“不管我们国家是不是富裕,我们都应该向贫穷国家提供国际援助”等涉及社会意识的题目。

为了用更少的变量理解原本题目想要探究的内容,我们要对这个题目进行因子分析。首先,样本量为3781份,且样本量与变量之比大于10:1,样本量较为合适。

点击分析——降维——因子

将所有11个选项放入“变量”中

点击“描述”,在“相关性矩阵”下面选择系数、显著性水平、反映像、KMO和巴特利特球形度检验,点击“继续”

点击“提取”,在“方法”中选择“主轴因式分解”,点击“确定”

结果如下所示:
首先是一个硕大无比的相关性矩阵。因为矩阵中大部分相关大于0.3,说明可以做因子分析。

在接下来的KMO和Bartlett球形检验中,KMO的值为0.863,Bartlett球形检验结果显著,满足进行因子分析的前提。

反映像相关矩阵的对角线上都大于0.5,同样满足前提假设。

3
如何用SPSS进行因子分析?

通过上述检验,我们可以看到当前的示范数据是非常适合进行因子分析的。那么问题来了——怎么确定要将变量分为多少个公因子呢?
实际操作中,我们常常会借助以下几个准则:
(1)特征值准则:将特征值大于等于1的主成分作为引子,放弃小于1的主成分。
(2)碎石检验准则:按照因子提取顺序画出因子的特征值随因子个数变化的散点图。曲线开始变平的前一个点作为提取的最大因子数。后面的散点就像山脚下的碎石,舍去“碎石”并不会损失很多信息。

在SPSS操作中,可以通过以下方法完成:
依然选择分析——降维——因子,将11个选项放入“变量”中。在“提取”中“展示”下面勾选碎石图,点击确定。
首先从“总方差解释”中可以看到,三个特征根大于1的因子共解释了总方差的47.906%。

碎石图如下:

结合碎石图和特征根大于1的标准,尝试抽取3个因子。再进入下一步操作:
依然选择 分析——降维——因子,将11个选项放入“变量”中。在“提取”中选择“固定因子数目”,输入3。

点击“选项”,勾选“禁止显示小系数”,绝对值输入0.3

点击“选择”,在“方法”处勾选“直接斜交法”。

点击确定查看结果:
从“因子矩阵”中可以看出,三个因子均存在因子载荷大于0.3的变量,说明选择三个因子是合适的;因为有很多变量存在交叉载荷,继续看下方的“模式矩阵”。

可以看到,斜交旋转后的大部分变量都只在一个因子上有较高的载荷,而且绝对值都在0.3以上;如果存在因子载荷值特别低的题目,可以考虑将对应题目删除。
根据每个因子下面题目的意义,我们就可以对因子进行命名了。比如在这个案例中,我可以姑且将因子1命名为“传统价值观”,因子2为“现代价值观”,因子3为“民族主义”。这样,我们就完成了对11个变量的因子分析,将其简化为了三个可以代表变量基本结构的因子。

以上就是因子分析的详细操作啦!你学会了吗?
如果你还想学习更多量化研究方法,记得持续关注我哦!如果你有特别的量化研究问题,也可以考虑移步我的同名知乎平台Mior芈奥进行付费咨询哟~ 我们下期再见!

Mior芈奥 专注量化研究的传播学硕士 | 分享读书与旅行的心得 39篇原创内容 –> 公众号 *本文的写作参考郭志刚《社会统计分析方法》、刘红云《高级心理统计》

spss因子分析相关文章