如何理解结构方程模型_服务器知识

结构方程模型（SEM, Structural Equation Modeling）是建立在回归模型（Regression Models）的基础上，针对潜变量（Latent Variables）的统计方法。

&ltimg src="https://pic1.zhimg.com/v2-9097acc14cb5f4a901d4e2d1cf883030_b.png" data-rawwidth="308" data-rawheight="260" class="content_image" width="308"&gtf为latent variable, 例如智力、自尊等，在该SEM模型中为predictor。y1,y2,y3为observed variables, 即可直接测量得到的变量，在该SEM模型中为indicators。λ1-3为factor loadings，ε为residual error。

f为latent variable, 例如智力、自尊等，在该SEM模型中为predictor。y1,y2,y3为observed variables, 即可直接测量得到的变量，在该SEM模型中为indicators。λ1-3为factor loadings，ε为residual error。

先前提到SEM是建立在regression model基础上的，该模型可写为如下方程：

y1 = λ1*f + ε1

y2 = λ2*f + ε2

y3 = λ3*f + ε3

即可看到与regression model的联系。

SEM较为广泛应用的是方差/协方差估计法。即可由上述方程写出关于y1,y2,y3的方差/协方差矩阵：（σ为f的variance）

&ltimg src="https://pic3.zhimg.com/v2-4d1ae9e59cf5987bc5ad78ac07b42c7a_b.png" data-rawwidth="453" data-rawheight="93" class="origin_image zh-lightbox-thumb" width="453" data-original="https://pic3.zhimg.com/v2-4d1ae9e59cf5987bc5ad78ac07b42c7a_r.png"&gt而后计算机根据实际矩阵，对factor loadings等parameters进行估计并输出估计矩阵，与实际矩阵差异最小（最理想）时，即输出结果，得到各估计参数和拟合指数。

而后计算机根据实际矩阵，对factor loadings等parameters进行估计并输出估计矩阵，与实际矩阵差异最小（最理想）时，即输出结果，得到各估计参数和拟合指数。

应用较多的模型/方法：MIMIC, multiple group models（比较组间差异）, latent growth modeling（比较纵向差异）等。

应用广泛的软件：

1、Mplus。优点：编程简单，结果全面。缺点：收费，贵。学生版是300$。

2、Amos。优点：傻瓜，画图拖数据即可。缺点：模型稍一复杂就很费时。

3、R。下个package即可。优点：兼容性、专业性强。缺点：用的人少，不利于伸手党。

4、LISREL。优点：易入门。缺点：需输入各矩阵，略过时。

其他还有一些软件，不了解。

SEM入门不久，以上为个人理解，求探讨求轻喷。么么哒

可以用，多阶段抽样（Multistage sampling）：是指将抽样过程分阶段进行，每个阶段使用的抽样方法往往不同，即将各种抽样方法结合使用，其在大型流行病学调查中常用。非概率抽样是适合商场的，他们抽查东西是随机的抽样，目的是能得到更高的商品质量的报告。概率抽样又称随机抽样.概率抽样以概率理论和随机原则为依据来抽取样本的抽样,是使总体中的每一个单位都有一个事先已知的非零概率被抽中的抽样。总体单位被抽中的概率可以通过样本设计来规定，通过某种随机化操作来实现,.虽然随机样本一般不会与总体完全一致,但它所依据的是大数定律,而且能计算和控制抽样误差,因此可以正确地说明样本的统计值在多大程度上适合于总体,根据样本调查的结果可以从数量上推断总体,也可在一定程度上说明总体的性质,特征.概率抽样主要分为简单随机抽样,系统抽样,分类抽样,整群抽样,多阶段抽样等类型.现实生活中绝大多数抽样调查都采用概率抽样方法来抽取样本.原则概率抽样的基本原则是:样本量越大，抽样误差就越小，而样本量越大，则成本就越高。根据数理统计规律，样本量增加呈直线递增的情况下(样本量增加一倍，成本也增加一倍)，而抽样误差只是样本量相对增长速度的平方根递减。因此，样本量的设计并不是越大越好，通常会受到经济条件的制约。原理市场调查方法A 案头调研案例研究法 B 不重复抽样 C 抽样调查重置抽样抽签法产品留置测试 D 多维尺度法定量研究方法定性研究方法典型调查法电话调查多阶段抽样等距抽样独立控制配额抽样等距量表等比量表 E 二手资料调研二路焦点小组 F 非概率抽样分层抽样分层比例抽样分层最佳抽样 G 观察法概率抽样拐点调研滚雪球抽样 H 会议调查 J 焦点访谈法经验判断法随机抽样家庭日记法经销商访谈 K 可行性研究 L 联合分析法留置调查垃圾调研法类别量表 M 面谈访问法盲测描述性调研 P PPS 判断抽样配额抽样平衡量表法评价量表配对比较量表 Q Q分类法 R 任意抽样 S 容量测定法 SEM模型深层访谈法双重抽样实验调查法实地调研数值分配量表随机号码表法顺序量表 T 投影技法推销估计法投射研究探索性调研 W 文献调查法问卷调查法网络调研文案调查法无准备访问网上调查 X 询问法辛迪加调研行踪分析相互控制配额抽样 Y 邮寄调查因果性调研 Z 主观概率法整群抽样重点调查逐户寻找法概率抽样之所以能够保证样本对总体的代表性，其原理就在于它能够很好的按总体内在结构中所蕴含的各种随机事件的概率来构成样本，使样本成为总体的缩影。优点⑴ 概率抽样包括以下几个方面的优点:调查者可获得被抽取的不同年龄、不同层次的人们的信息能估算出抽样误差调查结果可以用来推断总体。例如，在一项使用概率抽样法的调查中，如果有 5 %的被访者给出了某种特定回答，那么，调查者就可以以此百分比再结合抽样误差，推及总体情况。⑵ 另一方面，概率抽样也有一些弊病:-在大多数案例中，同样规模的概率抽样的费用要比非概率抽样高-概率抽样比非概率抽样需要更多时间策划和实施-必须遵守的抽样计划执行程序会大量增加收集资料的时间。方法概率抽样包括有简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)、整群抽样、多段抽样、PPS抽样和户内抽样。等距抽样在定量抽样调查中，等距抽样常常代替简单随机抽样。由于该抽样方法简单实用，所以应用普遍。等距抽样得到的样本几乎与简单随机抽样得到的样本是相同的。等距抽样的基本做法是，将总体中的各单元先按一定的顺序排列、编号，然后决定一个间隔，并在此间隔基础上选择被调查的单位个体。样本距离可通过下面公式确定:样本距离 =总体单位数∕样本单位数例如，假设你使用本地电话本并确定样本距离为 100 ，那么 100 个中取 1 个组成样本。这个公式保证了整个列表的完整性。等距抽样方式随意用一个起点，例如，如果你把一本电话本作为抽样框，必须随意取出一个号码决定从该页开始翻阅。假设从第 5 页开始，在该页上再另选一个数决定从该行开始。假定选择从第 3 行开始，这就决定了实际开始的位置。等距抽样方式相对于简单随机抽样方式最主要的优势就是经济性。等距抽样方式比简单随机抽样更为简单，花的时间更少，并且花费也少。使用等距抽样方式最大的缺陷在于总体单位的排列上。一些总体单位数可能包含隐蔽的形态或者是"不合格样本"，调查者可能疏忽，把它们抽选为样本。分层抽样定量调查中的分层抽样是一种卓越的概率抽样方式，在友邦公司以往的调查中经常被使用。分层抽样的具体程序是:把总体各单位分成两个或两个以上的相互独立的完全的组(如男性和女性)，从两个或两个以上的组中进行简单随机抽样，样本相互独立。总体各单位按主要标志加以分组，分组的标志与我们关心的总体特征相关。例如，我们正在进行有关啤酒品牌知名度方面的调查，初步判别，在啤酒方面男性的知识与和女性不相同，那么性别应是划分层次的适当标志。如果不以这种方式进行分层抽样，分层抽样就得不到什么效果，花再多时间、精力和物资也是白费。分层抽样与简单随机抽样相比，我们往往选择分层抽样，因为它有显著的潜在统计效果。也就是说，如果我们从相同的总体中抽取两个样本，一个是分层样本，另一个是简单随机抽样样本，那么相对来说，分层样本的误差更小些。另一方面，如果目标是获得一个确定的抽样误差水平，那么更小的分层样本将达到这一目标。在调查实践中，为提高分层样本的精确度实际上要付出一些代价。通常，我们现实正确的分层抽样一般有三个步骤: 首先，辩明突出的(重要的)人口统计特征和分类特征，这些特征与所研究的行为相关。例如，研究某种产品的消费率时，按常理认为男性和女性有不同的平均消费比率。为了把性别作为有意义的分层标志，调查者肯定能够拿出资料证明男性与女性的消费水平明显不同。用这种方式可识别出各种不同的显著特征。调查表明，一般来说，识别出 6 个重要的显著特征后，再增加显著特征的辨别对于提高样本代表性就没有多大帮助了。第二，确定在每个层次上总体的比例(如性别已被确定为一个显著的特征，那么总体中男性占多少比例，女性占多少比例呢?)。利用这个比例，可计算出样本中每组(层)应调查的人数。最后，调查者必须从每层中抽取独立简单随机样本。整群抽样以上各种抽样类型全部是按单位抽取的，即按样本单位数，分别一个单位一个单位地抽取。在整群抽样中，样本是一组单位一组单位地抽取。整群抽样有两个关键步骤:-同质总体被分为相互独立的完全的较小子集。-随机抽选子集构成样本。如果调查者在抽中的子集中观察全部单位，我们就有了一级整群样本。如果在抽中的子集中再以概率方式抽取部分单位观察，我们就有了二级整群样本。分层和整群抽样都要将总体分为相互独立的完全子集。它们的区别是，分层抽样的样本是从每个子集中抽取，而整群抽样则是抽取部分子集。地理区域抽样是整群抽样的典型方式。挨门挨户去调查一个特定城市的调查者也许会随机抽选一些区域，较集中地访查一些群体，大量减少访问时间和经费。整群抽样被认为是概率抽样技术，因为它随机抽出群和随机抽出单位。值得注意的是，在整群抽样下，我们假定群中单位与总体一样存在异质性。如果一群中单位的特征非常相似，如果由于共同环境使群内差异小而群与群之间差异大。一般来说，要解决这个问题可以扩大群数，然后从各群中抽取少量单位数，以保证样本的代表性。

百度教育



https://www.sohu.com/a/386218186_698752

目前，空间计量经济学研究包括以下四个感兴趣的领域：

计量经济模型中空间效应的确定；合并了空间影响的模型的估计；空间效应存在的说明、检验和诊断；空间预测。

空间计量经济学模型有多种类型（Anselin，et al. 2004）。 首先介绍纳入了空间效应（空间相关和空间差异）、适用于截面数据的空间常系数回归模型，包括空间滞后模型（Spatial Lag Model，SLM）与空间误差模型（Spatial Error Model，SEM）两种，以及空间变系数回归模型——地理加权回归模型（Geographical Weighted Regression，GWR）。适用于时间序列和截面数据合成的空间面板数据计量经济学模型将在以后予以介绍。

空间滞后模型（Spatial Lag Model，SLM）主要是探讨各变量在一地区是否有扩散现象（溢出效应）。其模型表达式为：参数反映了自变量对因变量的影响，空间滞后因变量是一内生变量，反映了空间距离对区域行为的作用。区域行为受到文化环境及与空间距离有关的迁移成本的影响，具有很强的地域性（Anselin et al.，1996）。由于SLM模型与时间序列中自回归模型相类似，因此SLM也被称作空间自回归模型（Spatial Autoregressive Model，SAR）。

空间误差模型（Spatial Error Model，SEM）存在于扰动误差项之中的空间依赖作用，度量了邻近地区关于因变量的误差冲击对本地区观察值的影响程度。由于SEM模型与时间序列中的序列相关问题类似，也被称为空间自相关模型（Spatial Autocorrelation Model，SAC）。

估计技术：鉴于空间回归模型由于自变量的内生性，对于上述两种模型的估计如果仍采用OLS，系数估计值会有偏或者无效，需要通过IV、ML或GLS、GMM等其他方法来进行估计。Anselin（1988）建议采用极大似然法估计空间滞后模型（SLM）和空间误差模型（SEM）的参数。

空间自相关检验与SLM、SEM的选择：判断地区间创新产出行为的空间相关性是否存在，以及SLM和SEM那个模型更恰当，一般可通过包括Moran’s I检验、两个拉格朗日乘数（Lagrange Multiplier）形式LMERR、LMLAG及其稳健（Robust）的R-LMERR、R-LMLAG）等形式来实现。由于事先无法根据先验经验推断在SLM和SEM模型中是否存在空间依赖性，有必要构建一种判别准则，以决定哪种空间模型更加符合客观实际。Anselin和Florax（1995）提出了如下判别准则：如果在空间依赖性的检验中发现LMLAG较之LMERR在统计上更加显著，且R-LMLAG显著而R-LMERR不显著，则可以断定适合的模型是空间滞后模型；相反，如果LMERR比LMLAG在统计上更加显著，且R-LMERR显著而R-LMLAG不显著，则可以断定空间误差模型是恰当的模型。

除了拟合优度R2检验以外，常用的检验准则还有：自然对数似然函数值（Log likelihood，LogL）、似然比率（Likelihood Ratio，LR）、赤池信息准则（Akaike information criterion，AIC）、施瓦茨准则（Schwartz criterion，SC）。对数似然值越大，AIC和SC值越小，模型拟合效果越好。这几个指标也用来比较OLS估计的经典线性回归模型和SLM、SEM，似然值的自然对数最大的模型最好。

空间变系数回归模型及估计：就目前国内外的研究来看，大多直接假定横截面单元是同质的，即地区或企业之间没有差异。传统的OLS只是对参数进行“平均”或“全域”估计，不能反映参数在不同空间的空间非稳定性（吴玉鸣，李建霞，2006；苏方林，2007）。当用横截面数据建立计量经济学模型时，由于这种数据在空间上表现出的复杂性、自相关性和变异性，使得解释变量对被解释变量的影响在不同区域之间可能是不同的，假定区域之间的经济行为在空间上具有异质性的差异可能更加符合现实。空间变系数回归模型（Spatial Varying-Coefficient Regression Model）中的地理加权回归模型（Geographical Weighted Regression，GWR）是一种解决这种问题的有效方法。、空间计量主要命令

spmat 生成空间权重矩阵

spatwmat 用于定义空间权重矩阵

spatgsa 用于全局空间自相关检验

gsa表示global spatial autocorrelation

spatlsa 进行局部空间自相关检验

lsa表示local spatial autocorrelation

spatcorr 考察空间自相关指标对距离临界值d的依赖性

spatdiag 针对ols回归结果，考察是否存在空间效应

spatreg 估计空间滞后与空间误差模型

空间面板主要命令为：help xsmle

Spatial Autoregressive (SAR) model

xsmle depvar [indepvars] [if] [in] [weight] , wmat(name) model(sar) [SAR_options]

Spatial Durbin (SDM) model

xsmle depvar [indepvars] [if] [in] [weight] , wmat(name) model(sdm) [SDM_options]

Spatial Autocorrelation (SAC) model

xsmle depvar [indepvars] [if] [in] [weight] , wmat(name) emat(name) model(sac) [SAC_options]

Spatial Error (SEM) model

xsmle depvar [indepvars] [if] [in] [weight] , emat(name) model(sem) [SEM_options]

Generalized Spatial Panel Random Effects (GSPRE) model

xsmle depvar [indepvars] [if] [in] [weight] , wmat(name) model(gspre) [emat(name) GSPRE_options]

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/133981.html

如何理解结构方程模型

发表评论

评论列表（0条）