维普资讯 http://www.cqvip.com 378· 中国卫生统计2007年8月第24卷第4期 析因设计资料的单独效应分析* 南方医科大学公共卫生与热带医学学院生物统计学系(510515)谭旭辉 钱 俊 陈平雁△ 【提要】 目的探讨析因设计资料单独效应的分析方法。方法 分析单独效应的两种方法分别为基于析因分析 的整体标准误和基于单因素分析的局部标准误方法,前者使用SPSS软件中一般线性模型下Lmatrix子句实现。用模拟方 法分别比较两种方法的I型错误率和检验效能。结果使用两种不同标准误,统计分析结果存在较大差异。模拟结果显 示,两种方法的I型错误率非常接近,基于析因方差分析标准误的检验效能较高。结论基于析因分析整体标准误较基 于单因素局部标准误分析单独效应更为合理。 【关键词】 析因设计交互作用 单独效应一般线性模型 通常情况下,析因分析结果存在交互效应时,还应 进一步分析各因素的单独效应【1J。如果以A、B两个 因素的析因设计为例,单独效应比较一般是先固定A 因素的不同水平,进行B因素各水平的比较;然后固 定B因素的不同水平,进行A因素各水平的比较。分 析单独效应所基于的标准误有两种,一种是固定水平 下单因素的局部标准误,另一种是析因分析得到的整 体标准误(即误差项均方)。目前,国内外以使用前一 种方法较多。使用上述不同的标准误,所得结果也会 方差分析模型[ 】如下: z浊 ≠上 ai 融 Q0 £i使 其中z啦表示第巧组中的第惫个观察值; 表示总 体的平均水平;a 表示影响因素A在i水平下对应变 量的附加效应, 表示影响因素B在j水平下对应变 量的附加效应,( ) 为两者的交互效应,并满足:∑a i 1 =0、蓦 0和善( ) 0、蓦( )巧 0;£淤为一个 服从正态分布N(0, )的随机变量。 2.L矩阵 各不相同。本文将分析两种方法的差异,并探讨其合 理性,以期为析因分析情况下单独效应分析提供依据。 原理与方法 在SPSS的一般线性模型(GLM)中,线性假设的 般形式为LB=K【31,其中L为L矩阵,也称为对比 系数矩阵(由Lmatrix子句设定),K为K矩阵(由 1.方差分析模型 以r X s析因设计为例,设有A、B两个因素,因素 A有r个水平A1,…,A,,因素B有S个水平B1,…, Kmatrix子句设定)。通常情况下,如果不用Kmatrix 设定,K矩阵一般为0向量。向量B为一般线性模型 中的参数向量。假设A、B因素各有4个水平,则 平衡设计,每种组合的重复例数为 。 LB lip+ 12al+13a2+14a3+15a4+ 16ill+17fl2+18fl3+19fl4+ lloallfl+Illalfl2+112alf13+/13alf14+/14a2fll+llsa2f12+/16a2f13+/17a2f14+ /18a3f11+l19a3f12+12003f13+/21a3f14+/22a4fll+/2304f12+/240t4f13+/25a4f14 其中第一行是总体平均水平;第二行是A因素的主效 应;第三行是B因素的主效应;第四、五行是A和B的中Lmatrix语句结构为: Lmatrix‘a1和04的比较’A 1 0 0-1 交互效应。在SPSS中,我们使用以上模型来设置单 独效应之间的比较。例如L=(1,0,0,一1),B:(0t1, 2, 3,0t4)T,K=(0),化简后即为: 1= 4,这个正是 这里,Lmatrix表示L矩阵;‘a1和a4的比较’为此次比 较的命名;A为因素A的变量名;1 0 0—1为L矩阵向 量。 我们希望进行的A因素第一水平与第四水平效应之 间比较的检验假设。如果要检验这一假设,则在SPSS *基金项目:国家自然科学基金(30571621)、广东省科技计划项目 (2oo5B337O1OO5) 当A与B存在交互作用时,我们可先固定B因素 的某一水平(比如固定在1水平),比较A因素第一和 第四水平的效应差别,其语句为: Lmatrix‘ 1和a4的比较at B1’A 1 0 0—1 B*A 1 0 0—1 0 0 0 0 0 0 0 0 0 0 0 0 △通讯作者:陈平雁 维普资讯 http://www.cqvip.com
Chinese Joumal of Health Statistics,Aug 2007, o1.24,No.4 379· 实例分析 /lmatrix=“B1一B3 at A2” drugb 1—1 0 druga*drugb 0 0 0 1—1 0 0 0 0: drugb 1 0—1 druga*drugb 0 0 0 1 0—1 0 0 0 【实例】 观察A、B两种镇痛药物联合运用在产 妇分娩时的镇痛效果。A药取3个剂量:lmg,2.5mg, 3mg;B药也取3个剂量:5,15,30;共9个处理组。 将27名产妇随机等分9组,记录分娩时的镇痛时间, 见表1。试分析A、B两药联合运用的镇痛效果。(孙 振球主编.医学统计学(第二版)P241) 此例题是一个3 X 3的析因设计,首先进行析因分 析,结果如表2。可见A药和B药存在交互作用,需进 /lmatrix=“B1一B3 at A3” drugb 1—1 0 druga*drugb 0 0 0 0 0 0 1—1 0: drugb 1 0—1 druga*drugb 0 0 0 0 0 0 1 0—1 上述程序中,“ ”为镇痛时间;“druga”和“drugb” 分别代表2种药物,且各有3个剂量水平。该程序前 7行语句表示析因分析,第8行以后表示基于析因分 析整体标准误的单独效应分析。 步分析A药和B药的单独效应。单独效应分析根 据计算标准误的不同有下述两种方法。 表1 A,B两药联合运用的镇痛时间(min) 基于固定水平单因素局部标准误的单独效应分 析,其结果见表3标注“*”处。例如,固定A药于 1.0mg水平,药物B的三种水平之间采用One—way ANOVA得:F=0.910,P=0.452,余类推。 基于析因分析整体标准误的单独效应分析【4】,其 结果见表3标注“#”处。例如,固定A药于1.0mg水 平,药物B的三种水平之间采用One—way ANOVA 进行变异分解,但是,误差项的均方及自由度是析因分 析的误差项均方387.963和自由度18(表2),求得:F =0.652,P=0.533,余类推。 析因分析及其基于析因分析整体标准误的单独效 应分析可通过SPSS的GLM模块及Lmatrix子句实 现,下面以固定A药不同水平比较B因素的单独效应 为例,给出SPSS程序如下: UNIANOVA Y BY druga drugb /METHOD=SSTYPE(3) /INTERCEPT=INCLUDE /PRINT=DESCRIPTIVE /CRITERIA=ALPHA(.05) /DESIGN=druga drugb druga*drugb /lmatrix=“B1一B3 at A1” drugb 1—1 0 druga*drugb 1—1 0 0 0 0 0 0 0; drugb 1 0—1 druga*drugb 1 0—1 0 0 0 0 0 0 表2析因设计的方差分析结果 表3两种不同误差项计算结果的比较 A药(II】g)——— 5 15 30 *使用One—wayANOVA得到的F僵和P值; #基于析因分析误差均方进行One—wayANOVA检验得到的F值和 P值。 由表3可见,两种方法所得的结果均不相同,多数 情况下,基于整体标准误的方法P值较小,即更为敏 感。为了验证两种方法的敏感性,我们初步进行了模 拟,不同总体的参数设置为M1B1=10; A1B2:8;/ ̄Alm =6; A2B1=15; A2B2=12; A2B3=8;/ ̄a3m:6;/ ̄a3B2= 10;/ ̄a3B3=13。相同总体的参数设置,每种组合的总 体均数都为10。两种参数设置的总体方差均为4,样 本量均为3,模拟次数为10 000次。模拟结果显示,对 于相同总体情形,基于局部标准误的第一类错误率为 0.050 98,基于整体标准误的第一类错误率为0.051 2,可见两种方法的一类错误率非常接近,且接近设定 的检验水准0.05。对于不同总体情形,基于局部标准 误的检验效能为0.713,基于整体标准误的检验效能 为0.814,可见在相同一类错误率的情况下,基于整体 标准误的单独效应比较方法具有更高的检验效能。 讨 论 当析因分析因素间存在交互作用时,单独效应分 (下转第382页) 维普资讯 http://www.cqvip.com
382· 中国卫生统计2007年8月第24卷第4期 也有可能导致结果偏倚。国内不少文献报道了体力活 讨 论 动、健康教育等等因素会影响2型糖尿病患者的生存 质量,但本例并未发现这些因素对生存质量的影响有 1.从理论上讲,SEM较适合用于慢性病患者生 统计学意义。其原因可能与本例的外源观测变量和外 存质量影响因素的探讨。但一个外源潜变量一般都对 源潜变量、内源观测变量和内生潜变量之间实际上是 应有多个外源观测变量,因此该外源潜变量与相应的 非线性关系有关。但非线性结构方程理论目前尚不完 内生潜变量路径之间的参数标准解若有统计学意义, 善,有待进一步研究。 就意味着该内生潜变量与这些外源观测变量之间均有 统计学意义,而该内生潜变量与个别外源观测变量之 参考文献 间有统计学意义,在专业上很难得到合理的解释。因 1.孟鸿伟.模型构建方法与结构方程建模——与张建平同志商讨.心 此,拟合SEM时,一是要根据专业知识确定哪些外源 理学报,1994,4(26),437 439. 2.候杰泰,温忠麟,成子娟.结构方程模型及其应用.北京:教育科学出 观测变量进入模型;二是需要综合考虑模型拟合的修 版社。2004,l12.115. 正指数是否能达到统计学要求和模型拟合结果在专业 3.Marsh H W.Hau K T&Wen Z.In search ofgolden rules:Commenton hypothesis testing approaches to setting cut off values for fit indexes and 上是否能得到合理解释,反复修正模型假设,直到两个 dangers in overgenera lising Hu&Bentler’fingdings.Structural Equa— 方面均达到要求为止。 tion Mod吐ng,2004,l1:320-341. 2.拟合SEM时,一般都假定外源观测变量和外 4.Steiger J H.Structure model evaluation and modiifaction:An interval e3一 timation approach.Multivariate Behavioral Research,1990,25:173— 源潜变量、内源观测变量和内生潜变量之间为线性关 180. 系,但实际上它们之间的关系有可能是非线性的,因 5.Michael W。Brone&MacCaJJUlTI.When fit indices and residuals are in— compatible.Psychologiacl Methods,2002,7(4):403-421. 此,有时即使模型拟合结果达到以上两个方面的要求, 6.WWW.mapi-research.inst.org[OL]. (上接第379页) Jun,ChertPingyan.Department ofBiostatistics,School ofPublic 析显得尤其重要。单独效应分析时,采用两种不同的 Health and Tropical Medicine,Southern Medical University 标准误计算方法会得到不同的分析结论。那么,哪种 (510515),Guangzhou 方法更为合理呢?我们认为,对于析因设计资料的单 独效应分析,如果不采用基于析因分析整体标准误的 [Abstract】 Objective To explore the methods of naaly ̄s of simple effect on factorila design.Methods Two methods,one W88 based 方法,将会导致忽略整体信息的错误,从而使分析结果 on the mean square of error term coming from factorila analysis(SE1)and 带有局限性。 naother from one—way ANOVA(SE2),were employed to analyze simple 通过初步模拟研究发现,两种方法的一类错误率 effect on factorial design.The former w8s conductde under Lmatrix subeom- 非常接近,但是基于整体标准误的单独效应比较方法 mand inGLM.The simulatingmethodWaS usedto comparethetypeI error 较基于局部标准误的方法具有更高的检验效能。因 nad testing power.Results Considerable differences were manifested be- twinthe resultsfromtwomethods baSed onthe real exampie.The simula- 此,我们更有理由认为基于析因分析误差均方的计算 tion results showed that the type I err0r were nearly equal to each other. 方法更为合理。 and the method based on SE1 had higher testing power.Conclusion The SPSS软件的Lmatrix子句能正确选择整体方差 method based on SE1 for simple effect analysis under factorila design WaS 分析的误差项,还能灵活定义多重比较中两两比较的 more reasonable than one based on SE2. 组合,因此可以很方便地实现基于整体标准误的单独 【Key words】 Factorial design;Interaction;Simple effect; 效应分析,例如,实例中固定A药于1.0mg水平,药物 GLM B的5/.tg和15t-tg两个水平的比较可用下述Lmatrix 参考文献 子句实现。 1.ArmJtage P,Cohon T.The Encyclopedia of Biostatistics,2nd Edition. /lmatrix=”B1 VS B2 at A1”drugb 1—1 0 druga* UK John Wiley&Sons Ltd.2005,2082. drugb 1—‘1 0 0 0 0 0 0 0 2.盛骤,谢式千,潘承毅.概率论与数理统计.北京:高等教育出版社, 本文仅对析因设计资料分析单独效应的两种方法 2003,272—276. 进行了比较,并初步做了模拟验证,至于其他的多因素 3.sPSS Inc.sPSS 13.0 Command syntax Reference.USA:sPSS Inc. 2O04.710—712. 设计类型及全面的模拟研究,还有待后续的深入研究。 4.Bowerman BTO’Cx,nneU R.App ̄ed statistics improving Business Pro- cesses.USA:Irwin.a Times Mirror Higher Education Group,Inc.com- Analysis of Simple Effect on Factorial Design Tan Xuhui,Qian pany,1997,1114.