您好,欢迎来到微智科技网。
搜索
您的当前位置:首页医学生论文中常见的统计学问题

医学生论文中常见的统计学问题

来源:微智科技网
218 2015年3月第34卷第3期Journal of Cardiovascular& DOI:10.3969/j.issn.1007—5062.2015.03.016 -医学教学与研究・ (论著) 医学生论文中常见的统计学问题 刘静 [关键词] 医学统计学;医学教育;论文 [中图分类号] R-05 [文献标志码] A [文章编号] 1007・5062(2015)03・218-03 论文是对学习和研究过程的综合性总结,是教 学活动的重要组成部分之一。对于医学生而言,撰 无论是医学生的毕业论文还是期刊论文,在方 法学部分都专设有“统计学方法”一节,要求将本研 究所采用的统计学方法说明清楚,以供读者评价或 验证统计结果是否正确。要做到这一点,就需要在 这一节对结果中涉及到的统计学方法逐一具体说 明,而结果中未涉及的方法则不应在这一部分出现。 写论文是一个运用所学的医学知识去分析、解决临 床诊疗或医学研究中具体问题的实践过程。除了医 学专业内容外,医学统计也越来越成为医学生毕业 论文或发表文章中不可或缺的一部分。医学统计学 是运用概率论和数理统计的原理和方法,紧密结合 医学实践,研究医药卫生领域中资料的收集、整理、 分析和推断的一门应用学科 。统计的过程不仅 仅是对研究数据进行的简单整理,更是一个总结归 当使用多种方法时,要清楚说明某种方法在何处使 用;一些特殊的方法需要解释和说明,必要时列出参 考文献。 如果对研究所采用的统计学方法说明不清楚, 纳、去粗取精、去伪存真的过程。合理地选择统计学 方法有助于揭示医学数据中的内在规律,从而做出 科学的推断与结论。鉴于统计学的重要性,目前各 医学院校都已将医学统计学设为本科生的专业基础 可能直接影响读者对论文结果的正确性做出判断。 例如,对某中华系列的医学杂志2008年发表论文使 用的统计方法进行的分析显示,高达74%的t检验 和68%的方差分析因在方法学部分说明不充分而 无法判断其应用的正确性 。 另外一个在统计方法说明部分常出现的严重问 题是描述的方法与结果中出现的方法不一致,即方 课。然而,由于一些医学生对抽象、复杂的数学公式 和符号缺乏兴趣,或认为统计学不过是“数字游 戏”,不够重视,导致在毕业论文或在学术杂志发表 的论文中常常出现统计学问题,直接影响了研究的 法学说明部分提及的方法在结果中并未使用或实际 使用的是另外的统计方法,这种问题将导致读者对 结果的真实性产生怀疑,严重影响对论文整体质量 的评价。 质量,有时甚至会得出错误的结论。本文对医学生 论文中常见的统计学问题进行了总结,以期帮助医 学生更有针对性地学好医学统计学的课程,更加合 理、有效地运用统计学方法从医学数据中提取信息, 得出可靠的结论,最终提高医学生论文的质量。这 些常见的统计学问题主要集中在对统计方法的说 二、对研究数据的描述 医学研究的对象都是有机的生命体,都存在个 体差异或称变异。例如,即使在同一实验条件下,相 同种系的小鼠对外界刺激的反应也会有差异。而临 床医学研究中作为研究对象的患者问的差异可能更 为明显。在撰写论文时,作者需要对研究对象的特 征进行描述。而当样本量较大时,不可能逐一描述 研究对象的特征,这时需要描述这批数据的特征,即 进行统计描述,包括定量资料的描述和定性资料的 描述。其中,论文中问题较多的是对定量资料的 描述。 明、对研究数据的描述和对统计方法的使用三个 方面。 一、对统计学方法的说明中存在的问题 作者单位:100029首都医科大学附属北京安贞医院一北京市心肺血 管疾病研究所流行病研究室 通信作者:刘静,研究员,研究方向:流行病与卫生统计学专业。E. mail:ejingliu@163.tom 2015年3月第34卷第3期Journal of Cardiovascular&Pulmonary Diseases.March 2015.Vo1.34.N0.3 219 定量资料的特征通常包括集中趋势(平均水 平)与离散趋势(变异程度)。均数4-标准差是最常 用的定量资料描述指标,但并非适用于所有定量资 料。对于呈正态分布(或近似正态分布和对称分 布)的定量资料,其平均水平可以用算数均数来描 述,变异程度则可用标准差来描述;而对于呈偏态分 布的资料,正/负偏锋的末端(即拖尾值)对资料的 均数影响较大,这时用算数均数就无法反映资料的 平均水平,故需将偏态分布的资料先进行正态性转 换(如对数转换)使之正态化,或采用中位数来表示 其平均水平,用四分位数间距来描述变异程度。 三、统计学方法使用的问题 1.忽略统计学方法使用的前提条件 随着统 计软件的广泛应用,有些医学生获得数据后直接选 择软件中常见的几种统计学方法进行分析,完全不 考虑本研究的数据是否满足该方法的使用条件。例 如,医学研究中经常要进行两组或多组间均数的比 较,有些医学生直接就采用t检验或方差分析进行 统计。实际上,t检验和方差分析都是参数检验,需 要满足前提条件:正态性和方差齐性。正态性是指 各组资料要服从正态分布(或近似正态分布);方差 齐性指各组资料取自的总体方差相等。目前常用的 统计软件都可以对资料的正态性和方差齐性进行验 证,但是很多学生都忽略了这一步,因而可能出现统 计学问题。只有按照各种统计学方法自身的适用条 件来合理使用,统计方法才能成为发现数据内在统 计规律的有力工具。 2.忽略研究设计,盲目套用统计方法(1)误 用t检验处理单因素多水平资料:t检验和方差分析 是医学论文中最常用的、也通常被认为是最简单的 统计学方法,然而实际应用中的正确率却低于 10%_2j。除了上述的说明不清楚和忽略使用条件 的问题外,忽略研究设计也常常是导致t检验和方 差分析使用错误的原因。对于呈正态分布的单因素 多水平定量资料,两组间的比较可用t检验;两组以 上资料的比较则需选用方差分析。有些医学生简单 地使用t检验来处理多组问的比较。这样做的问题 是由于多次采用t检验,增加了假阳性错误的概率; 同时失去了原来多组设计的意义,不能给出概括性 的结论,因此结论不可靠。正确的方法是当满足方 差分析的前提条件时应采用单因素多水平定量资料 的方差分析;当检验结果为各组总体均数间不完全 相等时,再进一步进行组问均数的两两比较。如果 当任何两个均数之间都要比较,可采用SNK法,而 如果要分别将各试验组与同一个对照组比较,可采 用Dunnett法。当资料不满足方差分析的前提条件 时,需对资料进行数据正态化处理或采用秩和检验。 (2)误用单因素方差分析处理重复测量的资 料:医学研究中常需要对同一受试对象的某项指标 在不同时点进行重复测量,此类资料即为重复测量 的资料,例如研究对象服用某种药物后多个时间点 的血压值。由于同一个体不同次测量的结果往往存 在相关性,这时用单因素多水平方差分析来比较不 同时点的测量结果是不恰当的,因为单因素方差分 析要求各比较组问是的。如果仅将两个时间点 上的数据放在一起进行配对t检验则割裂了原来多 组比较的整体设计。正确方法的方法是先判断重复 测量数据之间是否存在相关性(如SPSS的球形检 验),如不存在相关性,则采用单因素方差分析即 可;如存在相关性,则需进行重复测量数据的方差 分析 。 (3)误用)( 检验处理有序的列联表资料:对于 定性资料,很多医学生都会直接应用x 检验来处 理。实际上,因研究设计的不同,定性资料的列联表 又分为双向无序的列联表、单向有序的列联表和双 向有序的列联表等不同类型。对于双向无序的列联 表,可采用x 检验进行分析。但需注意的是在列联 表的)( 检验中,若P<0.05,只能得出总的结论。 如需进行两两比较时,因为重复多次的检验将使第 一类错误扩大,因此需重新设定检验水准,通常采用 eL a/N,其中N为所需检验的次数 。此外,医学 研究中还经常将某种定性的测量指标分成若干个有 序的等级,如疾病的不同严重程度和预后的不同水 平等,然后分类计数各组研究对象的具体状态。这 种资料属于有序的(等级的)列联表资料,看似可以 用x 检验处理,但x 检验只能比较各组的构成,而 与顺序或等级无关,因而此类资料应采用与分组顺 序有关的检验方法,如秩和检验和Ridit分析等 。 (4)将非同质的研究对象合并进行相关分析: 临床研究中经常采用病例一对照研究的设计,如糖尿 病患者和正常对照,有时还需按患者的不同特征分 为多组,如血糖正常、空腹血糖受损、糖耐量减低和 糖尿病四种情况。为了突出总样本量,有些医学生 把所有研究对象合计在一起进行分析。事实上,由 于各组研究对象在生物学特征上可能有明显差异, 这种合并分析需特别谨慎。尤其是进行相关分析 时,指标之间的关系在不同组之间可能完全不同,即 研究对象不同质,因此不应合并在一起进行相关 220 diovascular&urnal ofCar肺血管病杂志2015年3月第3 鲞筮 期 JoPulmonary Diseases,March 2015,Vo1.34,No.3 分析。 业人士可以通过菜单调用SAS过程。这些过程实 3.忽略临床意义,盲目追求统计学意义虽然 际是已被公认的SAS程序,使用者可以直接调用来 实现各种统计分析及其结果解释。然而,并非所有 分析任务都可以调用已有的SAS过程来实现。经 过训练的使用者可以自己编写SAS程序而完成更 统计软件和统计学方法可以帮助研究者发现数据内 在的统计规律,但统计规律不等同于事物的本质规 律。只有充分运用临床专业知识,才能正确地使用 统计方法,合理地解释统计结果,绝不能盲目追求统 计学意义而忽略其临床意义。这一问题在相关和回 归分析时经常出现。例如,很多学生在分析指标之 间的相关性时,对指标的生物学关联和分布特征完 为复杂的算法,实现SAS的强大功能。SPSS是另一 款广泛应用的统计软件。与SAS相比,SPSS的菜单 更加面向用户,熟悉Windows界面的用户可以轻松 点选菜单选择一种统计分析过程,并且设定参数和 全不加考虑,直接进行两两之间的线性相关分析,只 要P<0.05就认为两个指标相关。实际上,在进行 相关分析前,应做两个指标的散点图。如果两个指 标之间并非是线性关系,则不适用于线性相关分析; 如果散点图近似圆盘型,则说明两个指标问并无确 定的关系,即使P<0.05,也不能认为二者存在生物 学上的关联。在进行多因素回归分析时,专业知识 的运用就更为重要了。有些医学生不加考虑就直接 把十几个测量指标都作为自变量代入多因素分析, 或单纯依赖单因素分析,单因素分析显示有统计学 意义(P<0.05)的就代人多因素分析。这两种作法 都可能产生统计学问题。单纯根据单因素分析P< 0.05来筛选自变量时,有可能遗漏一些在多因素分 析中调整其他因素作用后反而具有统计学意义的指 标,因此有统计专家建议单因素分析P<0.5的变 量即可考虑代入多因素分析 。把所有相关因素 都直接代入问题更为严重。首先是自变量过多而样 本量不足,多元回归模型不稳定。另外,如果自变量 之间有高度的共线性,则可能导致错误的结果。例 如,把TC和LDL—C同时代入方程,由于前者包括后 者,二者高度相关,则可能出现一个与因变量呈正相 关而另一个呈负相关,或者二者都不相关,因而掩盖 了TC或LDL—C与因变量之间的关联。与此类似, 收缩压和舒张压,或其他密切相关的指标(往往提 示有内在的生物学关系)被同时代人多因素分析 时,往往无法得出可靠的结果。因此在筛选进入多 因素分析的自变量时,应该在参考单因素分析结果 的基础上,同时运用专业知识来进行筛选,才能对数 据做出全面、合理的分析。 许多医学生对统计学望而生畏是因为自认数学 功底不够,对复杂的计算公式往往退避三舍。统计 软件可以在一定程度上帮助这些医学生完成统计分 析。统计软件可以把使用者从复杂的统计公式中解 脱出来。目前,世界上最著名的统计软件是SAS和 SPSS。SAS是公认最具权威的国际标准软件。非专 选择项。对于医学生而言,统计软件使用的过程并 不复杂,关键在于如何选择合理的方法以及对分析 结果进行合理的解释。这一方面需要掌握一些统计 的基本知识,另一方面也需要结合专业知识进行 实践。 最后需指出的是,统计学方法的选择取决于研 究设计和收集的资料。因此,在研究设计阶段就应 1 2 i该对研究过程中将采用的资料收集和统计学分析方 法进行充分的考虑。否则,等到资料收集完成后单 纯依赖统计学方法并无法弥补研究设计和资料收集 的缺陷。为了规范医学论文中统计学方法的使用, 国内外的一些医学杂志已发表了相应的规范或指 南 ],值得医学生认真学习和参考。作为新世纪 的年轻人才,医学生应该把统计学作为将来从事医 学研究的基本功,认真学好医学统计学的知识,把统 计学的思维贯穿到医学研究中,从而提高论文的质 量,使学习和研究工作取得更好的成果。 参考文献 蒋知俭.医学统计学.北京:人民卫生出版社,1997:1. 张李军,余金明.中华心血管病杂志刊出科研论文的研究设 计及统计学方法分析.中华心血管病杂志,2009,37:648— 653. 张文彤.SPSS 11.0统计分析教程(高级篇).北京:北京希望 电子出版社,2002:36-43. 马斌荣.医学科研中的统计方法.北京:科学出版社,2001: 53. 刘明华,张晋昕.Ridit分析与秩和检验在等级资料处理时的 关系.循证医学,2010,10:282.285. 胡良平.心血管病科研设计与统计分析.北京:人民军医出 版社,2010:291-293. Ahman DG,Gore SM,Gardner MJ,et a1.Statistical guidelines for contirbutors to medical joumals.Br Med J(Clin Res Ed), 1983,286:1489—1493. 中华流行病学杂志编辑部.本刊财统计学方法的要求.中华 流行病学杂志,2014,35:976. 3  

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 7swz.com 版权所有 赣ICP备2024042798号-8

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务