学习笔记:通径分析

赵兴堂 0 数据分析师
       

       今天写一下我对通径分析的认识,分为4个部分:
       1. 通径图与模型    
       2. 模型系数的分解    
       3. 递归通径模型与非递归通径模型    
       4. 通径模型的识别(或称确认)与检验

       在研究多个相关变量间的线性关系时,除了可以采用多元线性回归分析和偏相关分析,还可以采用通径分析(path analysis),下面详细介绍上述4个内容。

       一、通径图与模型

       多变量统计分析是研究变量之间有相互联系、影响或有相关性的学科,最方便而又直观地表示变量间相互关系的方法是通径图。

       变量的分类

       按可否直接测量到该变量,变量可分为“表型变量”(manifest variable, 也称显变量,它总是用一个方框去识别它)及隐型变量(latent variable, 它总是用一个圆形框去识别它)。

       通径系数(path coefficient)

       通径图直观、形象地表达了相关变量间的关系,仅定性的表达还不够,还需进一步用数量表示因果关系中原因对结果影响的相对重要程度与性质,也就是必须用数量表示“通径”与“相关性”的相对重要程度与性质。其定义就是内生变量在外生变量上的偏回归系数。当表型变量是标准化数据时,通径系数就是标准化回归系数,单箭头上的小写字母表示通径系数,双箭头表示相关性,如果A1与B1是标准化变量,则双箭头上的r即是它们间的相关系数。

       二、模型数的分解
       1. 分解简单回归系数的通径分析
       2. 计算一个变量对最终反应变量的各种影响
       3. 以不同通径传递的间接影响
       4. 在控制某些变量的条件下的总影响的分解工作

       标准化数据中,通径图中任何两变量之间可以求模型的相关系数;在一个构造合适的通径图中,任何两个变量间的相关系数就是连接这两点之间所有复合链上的数值(相关系数及通径系数)的乘积之和。

       三、递归模型与非递归模型

       1. 递归通径模型
       因果关系结构中全部为单向链条关系,无反馈作用的模型,称为递归模型

       2. 非递归模型
       ⑴模型中的任何两个变量间存在双向因果关系,即有直接反馈作用
       ⑵某个变量存在自身反馈
       ⑶存在间接反馈
       ⑷内生变量的误差项与其他项目相关

       3. 递归通径分析的假设条件
       ⑴通径模型中各变量之间的关系为线性、可加的因果关系
       ⑵每一内生变量的误差项与其前置变量不得相关,同时也不得与其他内生变量的误差项相关
       ⑶模型中的因果关系必须为单向,不得包括各种形式的反馈作用
       ⑷各变量测量不存在误差

       四、通径图(模型)的识别(或称确认)

       通径图的完全性。一个合适的通径图中,所有外生变量之间,如有相关性,都应双箭头表示出来;所有内生变量之间不画相关性双箭头,但内生变量的残差之间如有相关性,则要用双箭头表示出来,没有双箭头的都被认为是不相关的。在内生变量与外生变量之间有显著意义的直接作用,其箭头都应被画出来。

       ⑴恰好通径图:通径图中独立未知参数(包括隐变量的方差、残差的方差)的个数恰好与样本中所能得出的方程组的个数相等

       ⑵识别不足通径图:通径图中独立未知参数的个数多于样本中所能得出的方程组的个数相等。因为这是参数的个数有无限多组,即解很不确定,这是不能允许的。

       ⑶过度识别通径图:通径图中的独立未知参数的个数少于样本中所得出的方程组的个数。统计学家偏爱这种模型,因为人们可以在待估的参数上附件不同的条件以使所求得的参数满足统计学要求。

       因此在构造统计图时,首先要识别一个通径图是否满足统计学的基本要求。基本原则是:尽可能用较少的参数去拟合样本数据,这样的结果也容易去寻找专业的解释。SAS及SPSS统计软件中的隐变量在执行统计分析时首先是计算待估参数的个数。对于“识别不足”的模型的通径图会自动停止计算。使用者如不想对模型的通径图作大的改动,一个简单的办法是,先指定一些未知参数的值,特别是隐变量的值,更是可以自由的指定。

       为作者投稿!
文章为作者独立观点,不代表经管之家立场

0

要评论?请先注册或者登录,可用人大经济论坛帐号登录。

^