某一值的离均程度。
什么是误差线?
误差线通常用于统计或科学数据,显示潜在的误差或相对于系列中每个数据标志的不确定程度。误差线可以用标准差(平均偏差)或标准误差,一般通用的是这两个。
(1)平均值±标准差(Mean±SD):
(2)平均值±标准误(Mean±SEM):
( 北大博士教你如何添加误差线 (sohu.com) )
误差线是通常用于统计或科学数据,显示潜在的误差或相对于系列中每个数据标志的不确定程度。误差线可以用 标准差 ( 平均偏差 )或 标准误差 ,一般通用的是这两个,如果是发英文文章,在caption中加以上bars donate S.D.(标准差)or S.E.(标准误差),中文文章可以不用说明。二 两种误差区别做误差线的话,标准差(std. deviation)和标准误(std.error)都可以,两者的侧重点不一样,一般用标准差(std. deviation)。
tips:两者区别
①概念不同;标准差是离均差平方和平均后的方根,标准误差定义为各测量值误差的平方和的平均值的平方根;
②用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等;
③它们与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。
(来自百度)
误差线用于指明度量中的估计误差;换而言之,误差线指明值中的不确定性。
在 Spotfire 中,可以在条形图、折线图和散点图中使用误差线。如果您可以通过 TIBCO Spotfire Business Author 许可证访问编写模式,则可以添加误差线;但如果分析是在 TIBCO Spotfire Professional 中创建的,则其中的图表可能已添加了误差线。条形图和折线图可以显示垂直误差。散点图可以显示垂直误差和水平误差。下图呈现了散点图标记上可能显示的四种误差。但是,上限误差和下限误差是指基础数据。这意味着如果您在图表中使用反转刻度,或更改条形图中条形的方向,那么误差线也将分别反转或更改方向。例如,对于使用反转 Y 轴的散点图,上限垂直误差将显示在标记下方,而不是标记上方。对于具有水平条形和非反转刻度的条形图,水平上限误差将显示在条形的右侧。
您可以选择仅显示其中一个误差线,或显示任意几个误差线。
误差线的长度表明值的不确定性。例如,对于平均值,长误差线表示对其计算平均值的集中度较低,因此平均值不确定。相反,短误差线表示值的集中度高,因此平均值更加确定。
在 Spotfire 中设置误差线的不同方法有两种。对于聚合值,您可以使用某一个现有度量值,例如 标准误差 或 标准偏差 。然后将在 Spotfire 中计算误差线的长度。在以下示例中,条形图显示了一年中每个月的平均销售额。统计测量标准误差用于计算上限误差线的长度。此图中未定义任何下限误差线。
定义误差线的另一种方法是使用现有数据表列中的值。例如,如下表所示,您可能拥有已计算平均值和误差值的数据表。然后,您可以使用这些列来设置误差线。在下面的散点图中,Y 轴表示“平均值”列,上限误差和下限误差分别表示“上限误差”和“下限误差”两列。
默认情况下,误差线相对于图表中的标记位置绘制,但对于某些度量值,这可能不是您要显示的内容。在这些情况下,自定义表达式可能很有帮助。
例如,如果标记表示聚合值(例如平均销售额),您可能希望显示最大值和最小值作为误差线。但是,如果您为下限误差选择度量值“最小值”,为上限误差选择度量值“最大值”,则误差线将不会显示最小值和最大值,因为误差线相对于标记位置显示。与此相反,上限误差会显示平均值加最大值,下限误差会显示平均值减最小值。要显示绝对最小值和绝对最大值,您需要使用自定义表达式。在这种情况下,上限误差的自定义表达式应为 Max([Sales])-Avg([Sales]),下限误差的自定义表达式应为 Avg([Sales])- Min([Sales])。
( 误差线 (tibco.com)
误差线并没有严格的定义,所以你需要看作图的作者是如何定义上下限的,也许是均值的标准差,也许是整个样本的标准差,也许是1倍,也许是1.96倍。总之,它们都是某种置信区间,要小心的是它到底是谁的置信区间。
假如实验设计了重复(至少3次以上),那么统计数据肯定需要以平均值 +/- 标准误差或者标准偏差表示
使用误差线要注明种类
要注明样本数n
误差线与显著性只用在独立重复实验上,代表性的实验结果不应该包含误差线与P值,因为这相当于n=1
推断性实验的误差线最好使用标准误或置信区间,对于n为3的实验,可直接列出3次的结果,不标注误差线
95%置信区间表示有95%信心里面有总体的均值,n为3时,标准误的4倍为这个区间
n为3,两倍标准误不重复覆盖,P <0.05, 刚好覆盖,P接近0.05;n大于10,间距1倍标准误,P接近0.05,两倍就是0.01
置信范围表示误差线时,n为3,重叠一臂,P为0.05;重叠半臂,P为0.01
同一组内的重复实验,标准误与置信区间不能用来表示组内差异
科学网—简析条形图(bar plot)上的误差线 - 于淼的博文 (sciencenet.cn)
R的功能很强大,各种包很多。但就是因为包太多,造成了很大的麻烦。不可避免的,可以做结构方程模型的包也不少,例如:sem、psych、OpenMx,lavaan等。我选择了lavaan包。原因:语法简介易懂,上手快,支持非正态、连续数据,可以处理缺失值。lavaan包是由比利时根特大学的Yves Rosseel开发的。lavaan的命名来自于 latent variable analysis,由每个单词的前两个字母组成,la-va-an——lavaan。
为什么说它简单呢? 主要是因为它的lavaan model syntax,如果你会R的回归分析,那它对你来说再简单不过了。
一、语法简介
语法一:f3~f1+f2(路径模型)
结构方程模型的路径部分可以看作是一个回归方程。而在R中,回归方程可以表示为y~ax1+bx2+c,“~”的左边的因变量,右边是自变量,“+”把多个自变量组合在一起。那么把y看作是内生潜变量,把x看作是外生潜变量,略去截距,就构成了lavaan model syntax的语法一。
语法二:f1 =~ item1 + item2 + item3(测量模型)
"=~"的左边是潜变量,右边是观测变量,整句理解为潜变量f1由观测变量item1、item2和item3表现。
语法三:item1 ~~ item1 , item1 ~~ item2
"~~"的两边相同,表示该变量的方差,不同的话表示两者的协方差
语法四:f1 ~ 1
表示截距
此外还有其它高阶的语法,详见lavaan的help文档,一般的结构方程建模分析用不到,就不再列出。
二、模型的三种表示方法
以验证性因子分析举例说明,对于如下图所示的模型:
方法一:最简化描述
只需指定最基本的要素即可,其他的由函数自动实现,对模型的控制力度最弱。只使用于函数cfa()和sem()
model<-'visual=~x1+x2+x3 textual=~x4+x5+x6 speed=~x7+x8+x9' fit <- cfa(model, data = HolzingerSwineford1939)
需要注意的是,这种指定模型的方式在进行拟合时,会默认指定潜变量的第一个测量变量的因子载荷为1,如果要指定潜变量的方差为1,可以:
model.bis <- 'visual =~ NA*x1 + x2 + x3 textual =~ NA*x4 + x5 + x6 speed =~ NA*x7 + x8 + x9 visual ~~ 1*visual textual ~~ 1*textual speed ~~ 1*speed'
方法二:完全描述
需要指定所有的要素,对模型控制力最强,适用于lavaan()函数,适合高阶使用者
model.full<- ' visual =~ 1*x1 + x2 +x3 textual =~ 1*x4 + x5 + x6 speed =~ 1*x7 + x8 +x9 x1 ~~ x1 x2 ~~ x2 x3 ~~ x3 x4 ~~ x4 x5 ~~ x5 x6 ~~ x6 x7 ~~ x7 x8 ~~ x8 x9 ~~ x9 visual ~~ visual textual ~~ textual speed ~~ speed visual ~~ textual +speed textual ~~ speed' fit <- lavaan(model.full, data = HolzingerSwineford1939)
方法三:不完全描述
最简化和完全描述的混合版,在拟合时增加 auto.* 参数,适用于lavaan()函数
model.mixed<- '# latent variables visual =~ 1*x1 + x2 +x3 textual =~ 1*x4 + x5 + x6 speed =~ 1*x7 + x8 +x9 # factor covariances visual ~~ textual + speed textual ~~ speed' fit <- lavaan(model.mixed, data = HolzingerSwineford1939, auto.var = TRUE)
可以设定的参数详见help帮助文档
PS:可以在lavaan()函数里设置参数mimic="Mplus"获得与Mplus在数值和外观上相似的结果,设置mimic="EQS",输出与EQS在数值上相似的结果
三、拟合结果的查看
查看拟合结果的最简单方法是用summary()函数,例如
summary(fit, fit.measures=TRUE)
但summary()只适合展示结果,parameterEstimates()会返回一个数据框,方便进一步的处理
parameterEstimates(fit,ci=FALSE,standardized = TRUE)
获得大于10的修正指数
MI<- modificationindices(fit) subset(MI,mi>10)
此外,还有其他的展示拟合结果的函数,功能还是蛮强大的
四、结构方程模型
(1)设定模型
model<- ' # measurement model ind60 =~ x1 + x2 +x3 dem60 =~ y1 + y2 + y3 + y4 dem65 =~ y5 + y6 + y7 + y8 # regressions dem60 ~ ind60 dem65 ~ ind60 + dem60 # redisual covariances y1 ~~ y5 y2 ~~ y4 +y6 y3 ~~ y7 y4 ~~ y8 y6 ~~ y8'
(2)模型拟合
fit <- sem(model, data = PoliticalDemocracy) summary(fit, standardized = TRUE)
(3)给回归系数设置标签
给回归系数设定标签在做有约束条件的结构方程模型时会很有用。当两个参数具有相同的标签时,会被视为同一个,只计算一次。
model.equal <- '# measurement model ind60 =~ x1 + x2 + x3 + dem60 =~ y1 + d1*y2 + d2*y3 + d3*y4 dem65 =~ y5 + d1*y6 + d2*y7 + d3*y8 # regressions dem60 ~ ind60 dem65 ~ ind60 + dem60 # residual covariances y1 ~~ y5 y2 ~~ y4 + y6 y3 ~~ y7 y4 ~~ y8 y6 ~~ y8'
(4)多组比较
anova(fit, fit.equal)
anova()会计算出卡方差异检验
(5)拟合系数
lavaan包可以高度定制化的计算出你想要的拟合指标值,例如,我想计算出卡方、自由度、p值、CFI、NFI、IFI、RMSEA、EVCI的值
fitMeasures(fit,c("chisq","df","pvalue","cfi","nfi","ifi","rmsea","EVCI"))
(6)多组结构方程
在拟合函数里面设置 group参数即可实现,同样的可以设置group.equal参数引入等式限制
五、作图
Amos以作图化操作见长,目前版本的Mplus也可以实现作图,那R语言呢,自然也是可以的,只不过是另一个包——semPlot,其中的semPaths()函数。
简单介绍一下semPaths()中的主要函数
semPaths(object, what = "paths", whatLabels, layout = "tree", ……)
(1)object:是拟合的对象,就是上文中的“fit”
(2)what:设定图中线的属性, 默认为paths,图中所有的线都为灰色,不显示参数估计值;
semPaths(fit)
若what设定为est、par,则展示估计值,并将线的颜色、粗细、透明度根据参数估计值的大小和显著性做出改变
semPaths(fit,what = "est")
若设置为stand、std,则展示标准参数估计
semPaths(fit,what = "stand")
若设置为eq、cons,则与默认path相同,如果有限制等式,被限制的相同参数会打上相同的颜色;
(3)whatLabels:设定图中线的标签
name、label、path、diagram:将边名作为展示的标签
est、par:参数估计值作为边的标签
stand、std:标准参数估计值作为边的标签
eq、cons:参数号作为标签,0表示固定参数,被限制相同的参数编号相同
no、omit、hide、invisible:隐藏标签
(4)layout:布局
主要有树状和环状两种布局,每种布局又分别有两种风格。
默认为“tree”,树状的第二种风格如下图,比第一种看起来舒服都了
semPaths(fit,layout = "tree2")
第一种环状
semPaths(fit,layout = "circle")
额,都揉成一团了!
试试第二种风格
semPaths(fit,layout = "circle2")
还好一点。如果把Rstudio默认的图片尺寸设计好,作图效果会更棒。
还有一种叫spring的布局,春OR泉?
semPaths(fit,layout = "spring")
看起来跟环状的很像。
详细内容可以阅读以下文献,以及相应的help文档:
[1]Rosseel Y. lavaan: An R package for structural equation modeling[J]. Journal of Statistical Software, 2012, 48(2): 1-36.
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)