文/勺海(北京)市场研究公司
自从AMOS、EQS等窗口化统计软件问世以来,结构方程模型的应用领域越来越广泛,那么,究竟什么是结构方程模型,它又能为我们解决什么问题呢?
结构方程模型(Structural Equation Modeling),又称为协方差结构模型(Conariance Structure Models),它是利用一定的统计手段,对复杂的理论模型加以处理,并根据模型与数据关系的一致性程度,对理论模型做出适当评价,从而达到证实或证伪研究者事先假设的理论模式的目的。
它实际是一般线性模式(General Linear Models, GLM)的扩展。所谓一般线性模式主要是指路径分析、典型相关、因素分析、判别分析、多元方差分析以及多元回归分析等,它们都只是结构方程模型的特例,都不具有结构方程模型那不可比拟的优点。
完整的结构方程模型包括测量模型(Measurement Model),即验证性因素分析模型(Confirmatory Factor Analysis)和结构模型(Structural Equation Model)。测量模型主要用于表示观测变量与潜变量之间的关系;而结构方程模型主要用来表示潜变量之间的关系。这可以用下图来说明。
图1结构方程模型图示
在上图完整的结构方程模型中,测量模型一回答的问题主要是,对于整体满意度而言,各观测变量的重要程度究竟是多少。这一目标用传统的多元回归的方法似乎也可以解决,例如建立回归方程:
整体满意度=A+B1×服务满意度+B2×产品满意度+B3×价格满意度
然后比较各观测变量的标准偏回归系数也可以得到关于各自重要性的结论。
那么我们为什么还要使用结构方程模型呢?这并非数字游戏的结果,确是因为结构方程模型具有传统回归所不可比拟的优势。我们知道传统回归方法的基本假设是,各观测变量没有测量误差,即各观测变量都是百分百测量的。其实,这一假设在测量理论和实际操作中都是不可能满足的。
经典测量理论认为:测验分数=真分数+误差分数,误差分数是无法避免的。同样,在实际操作过程中,系统误差和随机误差也是人力和主观愿望所无法控制的,但传统回归方法由于其方法本身的局限无法解决这一问题,只能给出低估观测变量重要程度的结果。所以,如果测量误差越大,传统回归所得结果的错误也越大。相比之下,结构方程模型则可以在模型设定时将各观测变量的误差项一一注明,从而给出更符合理论要求和实际操作情况的结论。
图1中的测量模型回答的主要是因果关系,即用户的整体满意度可以在多大程度上决定他的忠诚度。这一问题似乎也可以用另外的统计方法来解决,例如路径分析。但是对于图2、图3以及多因变量的模型,路径分析就显得捉襟见肘了。

路径分析的基本思路是以回归分析为基础。例如,对于图2,为了得到各路径系数,可以分别解下列回归方程:
产品品牌形象=A1+B1×整体满意度
用户忠诚度=A2+B2×整体满意度+B3×产品品牌形象+B4×竞争对手品牌
这样做的缺陷一方面是无法解决上面提到的回归的基本问题,还有一个重要的问题,就是路径分析面对这样的问题只能采用化整为零的分析策略,分别求解路径系数,这样并不能得到1+1=2的结果,所以仍然可能会得到错误的结论。对于图3中的非递归模型和多因变量模型,路径分析根本是无法解决的。
结构方程模型的基本思路是以协方差矩阵匹配的策略为基本思路,采用EM算法估计模型参数。从而克服了路径分析的上述缺陷。
结构方程模型的第三大优点是它更符合调研的思路。
和以往的统计分析方法出发点不同,结构方程模型是以样本协方差矩阵为分析的出发点,通过比较所建立的理论模型拟合的协方差矩阵(总体协方差矩阵)与样本协方差矩阵的差异,判断所观测的这一组数据是否支持所假设的理论模型。这就更符合我们做研究的思路。因为在对调研问题有了充分和深入地了解之后,我们对各变量之间的关系会有一个基本假设,那么得到的数据是否支持我们的基本假设,我们的假设是否是合理的,不完备的模型还需要进行什么修改等,这些问题都是非常重要的,但是以前的方法在回答这些问题时多少都有些力不从心。而结构方程模型通过对假设模型的协方差矩阵和所得数据的协方差矩阵进行比对,最终对假设模型的合理性作出判断,并提出修改的建议。这符合大多数研究的一般思路,也体现了我们对调研问题的深刻理解,以及我们从问题出发做调研的基本思路。
但是我们在应用结构方程模型时还应该注意一些问题,其中最主要的就是样本量的问题。
结构方程模型一般要求比较大的样本容量,究竟选取多大的样本容量合适,目前并没有明确的规则。
确定样本容量大小,需要考虑的问题之一是测量潜变量所用的观测变量的数目,所用的观测变量的数目越大,所需的样本容量就越大。
其次要考虑的是观测变量的多元正态性。如果所有的观测变量都服从多元正态分布,则只需较小的样本容量。Bentler 和Chou(1987)建议,如果所有变量都服从正态分布,样本容量与自由参数数目的比值达到5:1就足够,但也有建议10:1;如果变量非正态分布,需要较大的样本容量才能获得准确结果。
对于小样本,需要从根本上考虑该样本是否能很好代表总体。一个样本特有的性质会极大地影响分析结果,特别是当一个小样本碰巧不真实地代表总体时更有这种可能。而如果样本确实是随机获得,并且准确地代表了研究感兴趣的大群体,则样本容量较小并不会带来很多问题(Loehlin,1992)。
但是在应用结构方程模型时,样本量太小,或者缺失值太多,都很容易造成信息矩阵非正定。所以,一般分析过程中,应综合考虑多种因素,在可能的情况下,取较大的样本容量。



