论文发表中方差分析的常见误用
众所周知,方差分析比较常用的场合就是多组定量资料的比较,下面是小编搜集整理的论文发表中方差分析的常见误用,欢迎阅读查看。
应用中的主要几个问题有:
(1)缺乏对数据的正态性检验,组间比较都采用方差分析,而不考虑秩和检验。
(2)两两比较直接采用t检验,而不是专门的两两比较方法。
(3)采用方差分析处理重复测量资料,增加假阳性错误。
(4)实验设计考虑不周,误用其它设计的统计分析方法。
第一种错误比较明显,也都谈了好多年了,应该说是老生常谈的一个错误,只要大家有心,就不会犯这种明显的错误。前几天有人问我说:是不是组间比较前一定要做正态性检验,我看到好多人都没有做啊,都是直接就用方差分析。
这里就这个问题谈下个人观点。理论上,一定要做,别人不做,有两种可能,一是做了,只是没有在自己的结果中提及而已;二是真的没做。可能有的人觉得无所谓,不就是个正态性检验吗,提得多了都烦了。但是前提条件这种东西,一定要有的。否则就失去采用方法的意义了。有时候,有的指标,可能比较明显,肯定是正态,比如身高、体重等,可能你不提也没事。但是从稳妥的角度,建议还是只管提一下。其实做了也就是一分钟的事,文章中加上一句满足或不满足正态的话也不累赘,何苦不做呢?
第二种错误也是翻来覆去说了多少年了。两两比较不能用t检验,而要用两两比较的方法。而且两两比较方法的选择在前面的文章中也有介绍了,所以这种错误案例我也不举了。其实还是有很多。
下面主要通过2个例子来说明一下第三种和第四种错误。
例1:某研究欲分析某药物对骨质疏松的治疗效果,该研究将24只小鼠分为3组,第1组为正常对照组,第2组应用常规药物(A),第3组联合应用常规药物和该新药(A+B)。研究者对观测结果分析后,发现第3组和第2组之间差异有统计学意义,结论认为新药对治疗骨质疏松有效。
笔者分析:这个例子在前面文章中层提到过,但是当时没有从专业上解释的详细。应该说,这种形式的`设计在临床中不在少数。这里从专业上再说一下。这种研究涉及两个因素,每一因素各有2个水平,分别为常规药物(A)使用和不使用、新药(B)使用和不使用,因此两个因素组合后为4种处理。该研究中第3组比第2组多了B药,作者将两组的差异归因于多增加的B药的效果,认为新药对治疗骨质疏松有效,这一结论还是值得商榷的。因为如果A和B之间有交互效应的话,第3组就不仅包含B的作用,而且有A、B之间的交互作用。两组有差异可能是因为B的作用,也可能是因为A和B的交互作用。因此除非确定A和B之间完全独立,否则不能下结论认为两组差异是由于增加了B药造成的。
建议:该研究更好的做法是增加一组单独新药(B)组,这样就形成一个2×2的析因设计,然后采用析因设计的方差分析,既可以检验A和B的主效应,也可分析二者的交互效应。如果交互效应有统计学意义,可以提供更多的信息。
例2:某医院欲探讨准分子激光原位角膜磨镶术(LASIK)对患者视野的影响,对实施LASIK的46例近视患者分别于术前、术后1天、1个月、3个月、6个月用Humphrey 视野计30-2SITA快速阈值检测程序行视野检查。该研究采用随机区组设计的方差分析, 分析各时间点视野指数是否有统计学差异。部分分析结果列于下表。
笔者分析:该研究比较有代表性,目前临床中有不少类似研究,即对同一群患者施加干预后分别观察疗前和疗后不同时间点的指标值。在以前通常将此类设计归为随机区组设计中,将个体作为区组因素,时间点作为分组因素,统计分析采用随机区组方差分析。甚至在我当年读本科的时候,依然是这么讲的,作为随机区组设计。但大家慢慢发现,此类设计作为随机区组并不合适。为什么呢?在随机区组设计中,每一区组中的处理是随机分配的,也就是说,区组中的样品理论上是可以调换的。而本例研究中,时间点是无法随机分配的,只能是依次观察。你没有办法让明天挪到今天的前面去,这一点决定了他们还是有不同的。所以不能混为一谈。
建议:由于同一研究对象的多次观察之间很可能具有一定的相关性,采用重复测量方差分析更为合适一些。重复测量方差分析目前已经在国内用的越来越多了,不像以前只会用普通的方差分析。当然重复测量方差分析要稍微复杂一丁点,但是并不是特别复杂,但是它能说明很多问题,比如发展趋势问题,时间点的比较等等,都可以做到。关于重复测量方差分析会在后面文章中专门介绍。这里只是先简单提点一下。
总之,方差分析就跟t检验一样,看起来简单,用起来并不然。尤其方差分析涉及的内容更多,设计类型也更多,这就注定了它一定要比t检验复杂一些。真正用对的话,需要考虑很多方面,如设计类型、数据分布、两两比较、独立性等。方差分析是十分常用的,所以记住一些典型的错误案例,尽量在应用中避免这些错误,还是很有必要的。
【论文发表中方差分析的常见误用】相关文章: