友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!阅读过程发现任何错误请告诉我们,谢谢!! 报告错误
飞读中文网 返回本书目录 我的书架 我的书签 TXT全本下载 进入书吧 加入书签

女士品茶-第19章

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



定。他们的“讨论”包括对奈曼的学术生涯和以往建树的评论。我作为最后一记得的替补者加入到这个专题组中,并且被告之不能提及我先前和奈曼相处的经历(其实我根本没有这种经历)。因此,我就应他的本意,直接评论奈曼那天演讲的东西。我提到在几年前是如何发现了1939年的那篇论文,以及为了准备参加座谈会,重读了论文。我尽一切所能描述论文的内容,谈到奈曼创立的分布参数其意义的巧妙方式时,我显出极大的兴趣。
奈曼对我的评论显得非常高兴。之后,我们俩热烈地讨论了散播分布以及它的用法。几周以后,我收到寄来的一个大包裹,是一本加州大学出版社(The University of California Press)出版的《J?奈曼早期统计论文选》(A Selection of Early Statistical Papers of J。 Neyman),在书的内封有一行题词:“致大卫?萨乐斯伯格(David Salsburg)博士,衷心感谢他在1974年4月30日对我演讲的有趣讲评。J?奈曼。”
我把这本书视为珍宝,一是由于奈曼的题字,二是因为书中那一系列精美绝伦、文笔极佳的论文。从那时起,我有机会与奈曼的很多学生和同事交谈,得知这个我在1974年碰到的、友善的、风趣的、有感召力的人,也是他们深知并崇敬的人。
第11章 假设检验
在他们一开始合作的时候,E?皮尔逊就问耶日?奈曼,在检验一组数据是否为正态分布时,如果没能得到一个显著性的P值,那么怎样才能看这组数据是正态分布的呢?他们的合作从这个问题开始,然而,E?皮尔逊最初的这个问题,却打开了一扇通往更广阔领域的大门。在显著性检验中,如果得到的是一个不显著的结果,那么它的涵义是什么呢?如果我们找不到拒绝一个假设的证据,我们能做结论说这个假设为真吗?
费歇尔其实已经间接地回答了这个问题。费歇尔把比较大的P值(代表没有找到显著性证据)解释为:根据该组数据不能做出充分的判断。依据费歇尔的解释,我们绝对不会得出这样的推理,即没有找到显著性的证据,就意味着待检验的假设为真。这里引用费歇尔的原话:
相信一个假设已经被证明是真的,仅仅是由于该假设与已知的事实没有发生相互矛盾,这种逻辑上的误解,在统计推断上是缺乏坚实根基的,在其它类型的科学推理中也是如此。当显著性检验被准确使用时,只要显著性检验与数据相矛盾,这个显著性检验就能够拒绝或否定这些假设,但该显著性检验永远不能确认这些假设一定是真的,……如果显著性检验真的被人们理解到这种程度,那么就说明显著性检验的道理已被人们认识清楚了……
在这之前,K?皮尔逊常常利用他的卡方拟合优度检验来“证明”某些数据符合某些特定的分布。在费歇尔把更精确的方法引入到数理统计之后,K?皮尔逊的方法就不再为人接受了。但问题仍然存在。为了知道应该估计哪些参数,为了确定这些参数与所研究的科学问题之间有何关系,我们必须假设该数据符合某一特定的分布。统计学家们常常会利用显著性检验来证明数据符合何种分布。
在他们的通信往来中,E?皮尔逊与奈曼经常探讨一些由显著性检验中浮现出来的悖论,不假思索地使用一项显著性检验,可能会把一个显然为真的假设拒绝掉。但费歇尔从未陷入这种尴尬,因为对他来说,显著性检验怎样被误用他是非常清楚的。奈曼问:用什么标准来判断一项显著性检验的应用是正确的还是不正确的呢?逐渐地,随着E?皮尔逊与奈曼的书信往来,加上奈曼在暑期到英国的几次访问以及E?皮尔逊的几次波兰之旅,假设检验的基本思想已经浮出水面 。
现在,在所有基础统计学的教科书中,都可以发现一个简化的奈曼-皮尔逊假设检验理论公式。该公式结构简单,我发现大部分的大学一年级学生很容易看懂,因为已经被编纂整理过,所以这个公式很精确,也很有说服力。假设检验理论必须这样来写,当然这也是教科书所需要的写法,也只能这样来写。这种直接表述假设检验的方法已经被一些政府和社会机构所接受,如美国食品及药品管理局、美国环保署,许多医学院在给将来做医学研究的人授课时,采用的也是这一套方法。此外,这种方法也逐渐地被应用到了司法界,当法院处理某些需要鉴别的歧视性案子时,就经常会用到这种方法。
当由奈曼和E?皮尔逊创建起来的这种理论以奈曼的这种直接而简化的方式来讲授时,由于集中于公式中有错误的一面,从而曲解了他的发现。奈曼的主要发现是,除非至少有两个可能的假设,否则显著性检验根本就没有意义。也就是说,你不可能检验一组数据是否服从正态分布,除非你认为该组数据也可能会被其它的一些分布或分布集来拟合。这些备择假设的选择,决定了显著性检验的执行方式。当一个备择假设为真时,该备择假设被接受的概率奈曼称之为该检验的效力(power)。在数学里,要清晰阐述一种思想,通常要给某一特定的概念赋予清楚明确的定义。为了区别被用来计算费歇尔P值的假设与其它可能的一个或多个假设,奈曼和E?皮尔逊把被检验的假设称为“零假设”(null hypothesis),称其它可能的假设为“备择假设”(alternative hypothesis)。在他们的理论公式中,计算P值是为了检验零假设,而检验的效力则是指在备择假设为真的条件下P值的表现效果。
奈曼由此得出两个结论。第一个结论是,检验的效力是用来测量一个检验方法好坏的指标,两种检验方法中效力较强的方法就是较好的方法;第二个结论是,备择假设不能太多。统计分析师不能这样来表述,某一组数据来自于一个正态分布(零假设),或者它来自于任何其它可能的分布。这种备择假设集涵盖的范围太广了,没有哪种检验方法会有那么强的效力能处理所有可能的备择假设。
在1956年,芝加哥大学的L?J?萨维奇与拉杰?拉克?巴哈杜尔(Raj Raghu Bahadur)证明,对于一个零假设未通过的情形,并不一定要求有很多的备择假设。他们构建了一个相对较小的备择假设集,除此之外的所有检验的效力均为零。在20世纪50年代,奈曼就发展出了有限制的假设检验的想法,其中的备择假设集被定义得非常狭窄。他证明得出了这样的结论:这种检验方法比那些处理较多备择假设的检验方法效力更强。
在很多情况下,假设检验的目的是用来推翻零假设的,而这个零假设就好比我们所要攻击的稻草人。举例来说,当我们比较两种药的临床效果时,待检验的零假设是两种药的效果一样。但是,如果真是如此,研究工作就永远不必进行了。所以,“两种处理的效果相同”这一零假设,就是我们所要攻击的稻草人,应该被我们研究的结果来推翻。因此,根据奈曼的思想,该项研究的设计必须使最终数据有最大的检验效力,这样才能推倒这个稻草人,即表明这两种药的效果有多大的不同。

什么是概率?
遗憾的是,为了对具有内部一致性的假设检验设计出一种数学方法,奈曼必须处理一个已被费歇尔扫到地毯下的问题。这是一直困扰假设检验的一个问题,尽管奈曼的纯数学解非常简洁巧妙。这也是统计方法应用到一般的科学领域中通常会碰到的问题。从更一般的意义讲,这个问题可以这样来概括:在现实生活中,概率的意义是什么?
统计学的数学公式可用来计算概率。而这些计算出来的概率可使我们应用统计方法解决科学中的问题。就所用到的数学而言,概率的定义很明确。但这种抽象的概念怎样和现实相联系呢?当科学家试图决定什么为真、什么不为真时,他该如何解释统计分析的概率陈述呢?在本书的最后一章,我将讨论这个一般性的问题,并分析长久以来设法解答这些问题所做的努力。但现在,我们将分析促使奈曼找到他的答案的特殊情况。
前面我们谈过,费歇尔利用显著性检验产生了一个他称为P值的数字。这是一个计算出来的概率,是在零假设为真假定下,与观测数据有关联的一个概率。例如,假定我们要检验一种新药,对做过乳房切除手术的妇女来说,这种药可以防止乳腺癌的复发。我们把这种药的效果与一种安慰剂作比较。此时的零假设(那个稻草人)就是,该新药不比安慰剂好。现在,假定5年之后,用安慰剂的妇女有一半乳腺癌复发,但用新药的完全没有复发,这样能证明新药“有效”吗?答案当然得看这个50%代表多少病人。
如果在这项研究中,两组各仅有4名病人,也就是总共有8名病人,而其中2人在5年后复发。假定我们任选一个8人团体,把其中两人做上标记,接着把人随机分成两组,每组4人,那么做标记的两个被分在同一组的概率大约是0。30。因此,如果每组只有4名妇女,“所有复发的妇女都落在安慰剂组”是不显著的。如果该项研究中每一组包含500名妇女,且乳腺癌复发的所有250名妇女都落在安慰剂姐,这是极度不可能的,除非新药真的有效。如果新药并不比安慰剂有效,这250名妇女都落在同一组的概率就是P值,计算出来的结果将小于0。0001。
P值是一个概率,它就是这样被计算出来的。既然P值被用来表明一个假设(P值就是在该假设下计算出来的)为假的概率,那它的实际意义又是什么呢?答案是,P值是在极可能为假的条件下,与观测值相关联的一个理论概率。P值与现实没什么联系,它是一种对似是而非问题的间接测量。它不是我们错误理解的新药有效的概率,它也不是出现任何一种类型误差的概率。但是,为了决定哪一种检验方法比别的检验方法更好,奈曼必须想出一种办法把假设检验放进一个架构里,使得与根据检验所做
返回目录 上一页 下一页 回到顶部 0 0
未阅读完?加入书签已便下次继续阅读!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!