首页 理论教育 冯老师成功分享研究生师生数据分析方法

冯老师成功分享研究生师生数据分析方法

时间:2023-07-29 理论教育 版权反馈
【摘要】:无论是为了工程的需要、药效的分析、发表论文,还是基金资助机构、团体和企业,都会提出这样的“有效分析”要求。有些学科或专业的课题研究中,一半以上的研究任务是为了确定一个科学的“有效分析”程序。只要可能,对数据的干预应尽可能是处于“盲”的状态,有点像对博士论文的“盲审”,这样,研究人员就可以在不知道实验分组的情况下进行实验。

冯老师成功分享研究生师生数据分析方法

你通过研究和实验可以得到值得你高兴的一系列数据和有关结果,但你还不能过于陶醉。对科研人员来说,更富有挑战意义的工作是你如何表述和分析这些实验结果。多数实验结果都会以某种总结式的形式得到呈现,分析也会是客观的。这样的例子有平均数、中位数。跟着这些分析来的还有该组实验的观察次数和变化情况,比如范围、标准误差标准偏差。但要记住,简单的算术平均值,即使给出偏差,也可能并不反映数据的真实性质。平均值无法告诉你两组数据的分布是不是相似的,更不用说如果数据中有特别不一致的数值时,平均值肯定会掩盖数据的真实性质。在你没有成为处理这些数据的专家以前,向统计分析专家请教是值得的。通常的做法是在实验开始之前的设计阶段就去请教他们,你一定会不虚此行,他们会帮助你确定每一组实验的样本大小,也就是观察的次数,以便根据假定的量值发现统计的显著差异。无论是为了工程的需要、药效的分析、发表论文,还是基金资助机构、团体和企业,都会提出这样的“有效分析”要求。有些学科或专业的课题研究中,一半以上的研究任务是为了确定一个科学的“有效分析”程序。我们总不能在新型飞机的研制中让飞行员不间断地开上几十年,然后来告诉飞机运营商,这架飞机的寿命是多少年。发现统计的显著差异在需要用动物进行实验时也相当重要,因为它可以为建立确定量值的显著差异提供必需的最小观测值。我们可以拿几百只灯泡测试其寿命,但对于飞机和卫星这样昂贵的“样品”,一件样品也令人不可接受。记住,进行“有效分析”需要有某些被预测数据的信息,比如两个数据组之间的分布与变化以及预期的差异,而这些数据往往只有到实验进行之后,至少是最初的实验开始后,才能够得到。

统计分析不当是导致相当一部分科学研究失败的“祸根”。尤其是在生物学和生物医学的研究领域中,这样的例子不少。多数人在相关性不明显时就使用统计分析,但往往在实施中用错。专家们在统计方面对你的建议,不仅会让你避开错误的结果,使得研究走上正轨,而且能够很好地帮助你回答科研项目中期、后期审查中的提问,编辑和评审者的批评。一般来说,你没有必要对复杂精准的统计分析具备很深的造诣,也不必记住每一次测试所要用的公式,但是,必须知道每一次统计测试能够做什么,不能做什么,什么时候应该用,什么时候不适合用,这是最基本的。有的实验室配备了适用于本实验室的统计分析手册,往往包含着实验时抽样的方式、分析的公式、数据的专用表格,你在实验前要充分了解这些工具书籍。根据是否为正态分布,各组数据的方差是否相等,样本大小以及处理次数的不同,对各类数据采用不同的抽样方法和检验方法。如果拿不准,就要寻求帮助,一次不行再问第二次,这样做,下一组实验也许就会完全不同。你还可以参考一下有关著作,比如我与人合作的著作(冯长根,惠宁利,抽样检验,北京理工大学出版社,1992)。

我们在电视上都目睹过“去掉一个最高分、去掉一个最低分”那样的节目,这些做法看起来给人以“公正”的感受,但如果在三个实验中丢掉一个最高的、一个最低的,你剩下的那个数据真的那么合适吗?它可能远离了真实。在实验室中经常也要发生“不要数据”的情况。把那些看上去与其他测试组不协调的数据忽略掉,或者在第一次测试没有得到预期的或所希望的结果时尝试利用不同的统计方法,这些都是很有诱惑的。但是,在科技界,这种操纵数据的做法是不能被接受的,甚至可以说是一种近乎欺诈的行为。数据当然可以忽略,但必须是在获得结果之前就先制定出忽略的标准,比如规定当数值超出一定范围时予以忽略,并且每一组数据都必须严格进行相同标准下的忽略。

今天,多数研究者都会看到,用不着学习统计分析这类课程的专业不多。实际上,多数实验研究得到的数据要经过统计分析才是有意义的,但这个分析过程却也可能使你失去研究结果原本所具有的意义。我们常常可以看到,统计上的显著差异看起来很小,以至于不具有科学上的重要性。在有些情况下,比如在一次临床医学的大实验中,各组数据之间即使有微小的差异也很重要,但在许多实验系统中,它可能没有什么影响。统计学当然是重要的,但统计分析结果一模一样的数值,可能来自两个完全不同的实验母体,比如一个来自实验小鼠,一个来自实验猴子,你经过实验知道,它们是不同的。在统计学上经常把5%作为事件发生的接受水平,即概率小于0. 05 被称为小概率事件,这个数字并不存在不可思议的地方,它当然表示在20 个随机的测量中你总可能会看到某些差异。就算你掌握着最合适的统计分析,由于几率的存在和拙劣的实验设计,许多实验仍然会被导向错误的结论。(www.xing528.com)

让我们总感到统计分析是多么复杂的一件事,就是如何展示原始的数据,这些数据或者是一个单独的点,或者是摄影图像。后者已经被广泛地用于显示电子显微图、免疫组织化学、原位杂交等。这里存在的问题是,这些摄影图像是否能被读者确信为的确真实反映了实验中获得的全部数据,当然,作者总是这样描述的。没有一位作者会把质量差的图片放进来,有限的空间和昂贵的价格也阻止了作者使用过多的摄影图像。但无论如何,为了应对数据受到责疑,或者为了在审查人员或审稿人在合理范围内提出的要求,除了已提供的图像,你保存其他在实验中得到的图像资料是重要的。对于数字扫描和图像增强程序,保存原始数据显得更为重要。

主观的东西也是极容易被掺杂进科学研究中的,必须努力把它们降到最小。只要可能,对数据的干预应尽可能是处于“盲”的状态,有点像对博士论文的“盲审”,这样,研究人员就可以在不知道实验分组的情况下进行实验。同时让那些不参与实验的人掌握所有实验步骤或实验操作的信息,直到所有实验数据都已获得才将它们对研究者公开。对于新药的临床试验、外科内科干预的临床试验,这是一项基本要求,但也不能认为实验室的实验都必须如此。“盲”的要求在有一些场合是十分重要的,比如如果实验测试本来就带有主观性,信号的强弱以及等级的严格划分是根据观察者的判断,而不是靠客观分析确定的。除了“盲法”,在对某些经过选择的实验观察进行判断时,还应该由不知道实验细节或预期结果的独立观察者来查验。

(原文发表于《科技导报》,略有修改)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈