SD:标准差(StandardDeviation),又常称均方差,标准差是离均差平方和平均后的方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。
SEM:标准误(StandardErrorofMean),即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,反映的是样本均数之间的变异。标准误不是标准差,是多个样本平均数的标准差。
标准差与标准误都是数理统计学的内容,两者不但在字面上比较相近,而且两者都是表示距离某一个标准值或中间值的离散程度,即都表示变异程度,但是两者是有着较大的区别的。
首先要从统计抽样的方面说起。
标准差:表示的就是样本数据的离散程度。标准差就是样本平均数方差的开平方,标准差通常是相对于样本数据的平均值而定的,通常用M±SD来表示,表示样本某个数据观察值相距平均值有多远。从这里可以看到,标准差受到极值的影响。标准差越小,表明数据越聚集;标准差越大,表明数据越离散。标准差的大小因测验而定,如果一个测验是学术测验,标准差大,表示学生分数的离散程度大,更能够测量出学生的学业水平;如果一个测验测量的是某种心理品质,标准差小,表明所编写的题目是同质的,这时候的标准差小的更好。标准差与正态分布有密切联系:在正态分布中,1个标准差等于正态分布下曲线的68.26%的面积,1.96个标准差等于95%的面积。这在测验分数等值上有重要作用。
标准误:表示的是抽样的误差。因为从一个总体中可以抽取出无数多种样本,每一个样本的数据都是对总体的数据的估计。标准误代表的就是当前的样本对总体数据的估计,标准误代表的就是样本均数与总体均数的相对误差。标准误是由样本的标准差除以样本容量的开平方来计算的。从这里可以看到,标准误更大的是受到样本容量的影响。样本容量越大,标准误越小,那么抽样误差就越小,就表明所抽取的样本能够较好地代表总体。
拓展资料
标准差(StandardDeviation),在概率统计中最常使用作为统计分布程度(statisticaldispersion)上的测量。标准差定义是总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的离散程度。
假设有一组数值X1,X2,X3,......XN(皆为实数),其平均值(算术平均值)为μ,
标准差也被称为标准偏差,或者实验标准差,公式为
标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。
一、含义不同
mean表示都是平均数。
SEM是standard error of mean是平均数的抽样误差,反应平均数的抽样准确性。
SD全称standard deviation标准差,又常称均方差,是离均差平方的算术平均数的平方根,用σ表示。
二、用法不同
SEM计估计值的准确性无法度量,但可以用统计方法来测量。
测试的误差来源包括系统误差和采样误差,这些误差很容易克服,采样误差是由许多无法控制的内部和外部因素引起的,这些因素都是偶然的,即使在测试中非常小心也很难消除,但可以通过增加重复次数来减少。
小样本(n≤30)取平均值±标准差,大样本(n>30)取平均值±标准差。
三、类型不同
标准差是方差的算术平方根。标准差可以反映数据集的离散程度。如果平均值相同,则标准差可能不相同。
标准误差是用样品的标准偏差除以样品容量的平方根来计算的,标准误差受样本量影响较大,样本量越大,标准误差越小,抽样误差越小,说明样本能够更好地代表种群。
结构方程模型(SEM)包括连续潜变量之间的回归模型(Bollen, 1989Browne &Arminger, 1995Joreskog &Sorbom, 1979)。也就是说,这些潜变量是连续的。这里需要注意的是:1. 潜变量(latent variables)是与观察变量(Observed variables)相对的,可通过数据分析观察;2. 观察变量可以是连续的(continuous)、删失的(censored)、二进制的(binary)、有序的(ordinal)、无序的(nominal)、计数的(counts),或者是这些类别的组合形式。
SEM有两个部分:一个测量模型(measurement model)和一个结构模型(structural model)。
测量模型 相当于一个多元回归模型(multivariate regression model),用于描述一组可观察的因变量和一组连续潜变量之间的关系。在此,这一组可观察的因变量被称为因子指标(factor indicators),这一组连续潜变量被称为因子(factors)。
如何描述它们之间的关系?可以通过以下方式:
1. 若因子指标是连续的,用线性回归方程(linear regression equations);
2. 若因子指标是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);
3. 若因子指标是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);
4. 若因子指标是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);
5. 若因子指标是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。
结构模型 则在一个多元回归方程中描述了三种变量关系:
1. 因子之间的关系;
2. 观察变量之间的关系;
3. 因子和不作为因子指标的观察变量之间的关系。
同样,这些变量有不同的种类,所以要根据它们的类别来选择合适的方程进行分析:
1. 若因子为因变量,及可观察的因变量是连续的,用线性回归方程(linear regression equations);
2. 若可观察的因变量是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);
3. 若可观察的因变量是二进制的或者是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);
4. 若可观察的因变量是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);
5. 若可观察的因变量是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。
在回归中,有序的类别变量可通过建立比例优势(proportional odds)模型进行说明;最大似然估计和加权最小二乘估计(maximum likelihood and weighted least squares estimators)都是可用的。
以下特殊功能也可以通过SEM实现:
1. 单个或多组分析(Single or multiple group analysis);
2. 缺失值(Missing data);
3. 复杂的调查数据(Complex survey data);
4. 使用最大似然估计分析潜变量的交互和非线性因子(Latent variable interactions and non-linear factor analysis using maximum likelihood);
5. 随机斜率(Random slopes);
6. 限制线性和非线性参数(Linear and non-linear parameter constraints);
7. 包括特定路径的间接作用(Indirect effects including specific paths);
8. 对所有输出结果的类型进行最大似然估计(Maximum likelihood estimation for all outcome types);
9. bootstrap标准误差和置信区间(Bootstrap standard errors and confidence intervals);
10. 相等参数的Wald卡方检验(Wald chi-square test of parameter equalities)。
以上功能也适用于CFA和MIMIC。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)