统计中统计假设检验验的基本思想是什么请详细解释

假设检验的基本思想_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
假设检验的基本思想
阅读已结束,下载文档到电脑
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,方便使用
还剩13页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢统计学假设检验中 p 值的含义具体是什么? - 知乎2224被浏览122276分享邀请回答36435 条评论分享收藏感谢收起arxiv.org/pdf/.pdf其实 p-value 真的没有你们想象的那么厉害,它会被样本影响,会被停止规则影响,会被很多乱七八糟的事情影响。其实这个事情理解起来非常简单,我们知道p-value 它是一个随机变量。那么作为一个随机变量,它是有分布的,那么在原假设的情况下,它的分布是什么呢?p-value在原假设成立的情况下,它是服从均匀分布(uniform)的。p-value本身是从type-I error,也就是我们俗称的alpha 来的,而正因为alpha 是服从uniform 的distribution,我们才会说它是在假设原假设(H0)正确时,出现现状或更差的情况的概率。那如果有停止规则了呢?这时alpha的distribution 可就变了,例如在原假设p=1的情况中,按照@姚岑卓的说,alpha其实为0,因为在原假设成立的情况下,是不会有type-1 error的,那么也就是没有p-value的说法。说完停止规则,我们来说说样本的影响,样本的影响更具有现实应用意义。由于在没有互联网的时候,数据采集很难,我们总是把样本当作样本总体,因为数据本身就很少,迭代也并不快,所以这么做也没有什么关系。但是随着互联网的发展,这么做已经不是很合适了。举个现实中的例子。一个互联网网站,要做一个a/b testing,比如说就是检验一个工具的加入会不会增加用户对某个按钮的点击量。那么这个网站在今天收集了5000组用户数据,一组没有新工具,一组有新工具,发现p-value &0.05。那么这能说明这个工具有效果么?其实是不行的,原因是在原假设成立的情况下,p-value遵从均匀分布,出现一次p-value&0.05又有什么不可能,你第二天再做一次出现p&0.95都有可能的。所以experimental design 是怎么做的呢?我们日均有大量的数据,我们不停的做5000个样本的t-test,看p-value是否遵从均匀分布,如果不遵从,我们才可以说这个工具有效果。这不是我瞎说的哦,Dow Jones就是这么做的。只不过他们为了区别机器人的影响,做了很多假的样本,也就是a/a testing。在原假设成立的情况下(不引入工具的很多个样本相互比较),如果p-value 不服从均匀分布,那这里面就有机器人在作祟。这就是为什么我要强调p-value要针对样本。在题例中,射飞镖射10000次,你做t-test,p-value&0.05,那是说针对这10000次射飞镖,在假设原假设(H0)正确时,出现现状或更差的情况的概率小于0.05。你只是感觉10000次都这样了,那对于之后的几次应该都小于0.05,但这只是感觉。但你也可以每次射100支,一共做100次,每次都取个p-value,看p-value的distribution,发现并不是uniform的distribution,来说明原假设不成立。前者样本大,但对于总体说明小,后者样本虽小,但对于总体确实更有把握。403 条评论分享收藏感谢收起查看更多回答3 个回答被折叠()出自 MBA智库百科()
假设检验(Hypothesis Testing)
  假设检验是用来判断与样本,样本与的差异是由引起还是本质差别造成的方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
  生物现象的是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。假设检验的目的就在于排除抽样误差的影响,区分差别在上是否成立,并了解事件发生的概率。
  在工作中经常遇到两者进行比较的情况,如采购的验证,我们抽样所得到的数据在两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你所承担的。假设检验的思想是,先假设两者相等,即:μ=μ0,然后用统计的方法来计算验证你的假设是否正确。
  1.小概率原理
  如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。
  2.假设的形式
  H0——原假设, H1——
  双尾检验:H0:& = &0 ,
  单尾检验: ,H1:& & &0
, H1:& & &0
假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝解析失败 (PNG 转换失败; 请检查是否正确安装了 latex, dvips, gs 和 convert): H_0
,就接受H1。
  一般地说,对总体某项或某几项作出假设,然后根据样本对假设作出接受或拒绝的判断,这种方法称为假设检验。
  假设检验使用了一种类似于“反证法”的推理方法,它的特点是:
  (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。
  (2)它又不同于一般的反证法。所谓不合理现象产生,并非指上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过0.05的事件称为“小概率事件”,也可视具体情形而取0.1或0.01等。在假设检验中常记这个概率为α,称为。而把原先设定的假设成为原假设,记作解析失败 (PNG 转换失败; 请检查是否正确安装了 latex, dvips, gs 和 convert): H_0
。把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。
  假设检验可分为、、三类。
  包括三类:、、,用于检验样本是否来自于一个总体。
  检验分析方法和分析结果的准确度,考察对测试结果的影响。从统计意义上来说,各样本均值之差应在允许的范围之内。反之,如果不同样本的均值之差超过了允许的范围,这就说明除了随机误差之外,各均值之间还存在系统误差,使得各均值之间出现了。
  正态总体均值检验分为两种情况,
   是用小样本检验,特点是在均方差不知道的情况下,可以检验样本的显著性,分为单侧检验与双侧检验。当为双样本检验时,在两样本t检验中要用到。
从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或等方法。
  是一般用于大样本(即大于30)平均值差异性检验的方法。
  上面所述的检验都是基于样本来自正态总体的假设,在实际工作中,有时并不明确知道样本是否来自正态总体,这就为假设检验带来难度。非参数检验方法,对样本是否来自正态总体不做严格的限制,而且计算简单。统计工具箱提供了和秩和检验两种非参数检验方法。
  假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P&0.01或P&0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。
  1.确定检验规则
  检验过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝H0;反之,差异不显著,接受H0。
差异临界点判断
  怎样确定c?
  2.两类错误
  接受或拒绝H0,都可能犯错误
  I类错误——弃真错误,发生的概率为α
  II类错误——取伪错误,发生的概率为β
检验决策H0为真H0非真
拒绝H0犯I类错误(α)正确
接受H0正确犯II类错误(β)
  α大β就小,α小β就大
  基本原则:力求在控制α前提下减少β
  α——显著性水平,取值:0.1, 0.05, 0.001, 等。如果犯I类错误损失更大,为减少损失,α值取小;如果犯II类错误损失更大,α值取大。
  确定α,就确定了临界点c。
  ①设有总体:X~N(μ,&2),&2已知。
  ②:样本均值\bar{X}~N(\mu,\sigma^2/n)。
  ③标准化:
  ④确定α值,
  ⑤查概率表,知临界值
  ⑥计算Z值,作出判断。
  1、做假设检验之前,应注意资料本身是否有可比性。
  2、当差别有意义时应注意这样的差别在实际应用中有无意义。
  3、根据资料类型和特点选用正确的假设检验方法。
  4、根据专业及经验确定是选用单侧检验还是双侧检验。
  5、当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。
  6、判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。
  7、报告结论时是应注意说明所用的,检验的单双侧及P值的确切范围。
  假设检验与有密切的联系,我们往往可以由某参数的显著性水平为α的检验,得到该参数的置信度为1—α的,反之亦然。例如,显著性水平α的均值μ的双侧检验问题:
  H0:& = &0,
  与置信度为1-α 的置信区间之间有着这样的关系;若检验在α水平下接受H0,则μ的1 - α的置信区间必须包含&0;反之,若检验在 α水平下拒绝H0,则μ的1-α的置信区间必定不包含&0。因此,我们可以用构造μ的1-α置信区间的方法来检验上述假设,如果构造出来的置信区间包含&0,就接受H0;如果不包含&0就拒绝H0。同样给定显著水平 α,可以从构造检验规则的过程中,得到μ的 1-α置信区间。
如上例,μ的置信度为95%的为:
即置信区间为(80.55 , 85.45),因为&0 = 80,不在这个区间内,拒绝H0
  考虑下面三种类型的假设检验: (4.12)
  (1)(双边检验)
  (2)(右侧单边检验)
  (3)(左侧单边检验)
  例如:某公司想从国外引进一种自动加工装置。这种装置的工作温度X服从(&,52),厂方说它的平均工作温度是80度。从该装置试运转中随机测试16次,得到的平均工作温度是83度。该公司考虑,样本结果与厂方所说的是否有显著差异?厂方的说法是否可以接受?
  类似这种根据样本观测值来判断一个有关总体的假设是否成立的问题,就是假设检验的问题。我们把任一关于单体分布的假设,统称为统计假设,简称假设。上例中,可以提出两个假设:一个称为原假设或,记为H0:μ=80(度);另一个称为备择假设或对立假设,记为H1 :μ≠80(度)这样,上述假设检验问题可以表示为:
  H0:μ=80  H1:μ≠80
  原假设与备择假设相互对立,两者有且只有一个正确,备择假设的含义是,一旦否定原假设H0,备择假设H1备你选择。所谓假设检验问题就是要判断原假设H0是否正确,决定接受还是拒绝原假设,若拒绝原假设,就接受备择假设。
  应该如何作出判断呢?如果样本测定的结果是100度甚至更高(或很低),我们从直观上能感到原假设可疑而否定它,因为原假设是真实时,在一次试验中出现了与80度相距甚远的小概率事件几乎是不可能的,而现在竟然出现了,当然要拒绝原假设H0。现在的问题是样本平均工作温度为83度,结果虽然与厂方说的80度有差异,但样本具有随机性,80度与83度之间的差异很可能是样本的随机性造成的。在这种情况下,要对原假设作出接受还是拒绝的抉择,就必须根据研究的问题和决策条件,对与原假设的差异进行分析。若有充分理由认为这种差异并非是由偶然的随机因素造成的,也即认为差异是显著的,才能拒绝原假设,否则就不能拒绝原假设。假设检验实质上是对原假设是否正确进行检验,因此,检验过程中要使原假设得到维护,使之不轻易被否定,否定原假设必须有充分的理由;同时,当原假设被接受时,也只能认为否定它的根据不充分,而不是认为它绝对正确。
  在卷烟生产企业经常会遇到如下的问题:卷烟中要求烟支的某项缺陷的不合格品率P不能超过3%,现从一批产品中随机抽取50支卷烟进行检验,发现有2支,问此批产品能否放行?按照一般的:50支中有2支不合格品,不合格品率就是4%,超过了原来设置的3%的不合格品率,因此不能放行。但如果根据假设检验的理论,在α=0.05的显著性水平下,该批产品应该可以放行。这是为什么呢?
  最关键的是由于我们是在一批产品中进行,用抽样样本的质量水平来判别整批的质量水平,这里就有一个的问题。举例来说,我们的这批产品共有10000支卷烟,里面有4支不合格品,不合格品率是0.04%,远低于3%的合格放行不合格品率。但我们的检验要求是随机抽样50支,用这50支的质量水平来判别整批 10000支的质量水平。如果在50支中恰好抽到了2支甚至更多的不合格品,简单地用抽到的不合格品数除以50来作为不合格品率来判断,那我们就会对这批质量水平合格的产品进行误判。
  如何科学地进行判断呢?这就要用到假设检验的理论。
  步骤1:建立假设
  要检验的假设是不合格品率P是否不超过3%,因此立假设
  H0:P≤0.03
  这是原假设,其意是:与检验标准一致。
  H1:P>0.03
  步骤2:选择检验统计量,给出拒绝域的形式
  若把比例P看作n=1的二项分别b(1,p)中成功的概率,则可在大样本场合(一般n≥25)获得参数p的近似μ的检验,可得:
近似服从N(0,1)
  其中=2/50=0.04,p=0.03,n=50
  步骤3:给出显著性水平α,常取α=0.05。
  步骤4:定出临界值,写出拒绝域W。
  根据α=0.05及备择假设知道拒绝域W为
  步骤5:由样本观测值,求得样本统计量,并判断。
  结论:在α=0.05时,样本观测值未落在拒绝域,所以不能拒绝原假设,应允许这批产品出厂。
  假设检验中的两类错误。
  进一步研究一下这个例子,在50个中抽到多少个不合格品,就要拒绝入库呢?我们仍取α=0.05,根据上述公式,得出,解得x&3.48,也就是在50个样品中抽到4个不合格品才能判整批为不合格。
  而如果我们改变α的取值,也就是我们定义的小概率的取值,比如说取α=0.01,认为概率不超过0.01的事件发生了就是不合理的了,那又会怎样呢?还是用上面的公式计算,则得出,解得x&4.30,也就是在50个样品中抽到5个不合格品才能判整批为不合格。检验要求是不合格品率P不能超过3%,而现在根据α=0.01,算出来50个样品中抽到5个不合格品才能判整批为不合格,会不会犯错误啊!假设检验是根据样本的情况作的统计推断,是推断就会犯错误,我们的任务是控制犯错误的概率。在假设检验中,错误有两类:
  第一类错误(拒真错误):原假设H0为真(批产品质量是合格的),但由于抽样的随机性(抽到过多的不合格品),样本落在拒绝域W内,从而导致拒绝H0(根据样本的情况把批质量判断为不合格)。其发生的概率记为α,也就是显著性水平。α控制的其实是生产方的风险,控制的是生产方所承担的批质量合格而不被接受的风险。
  第二类错误(取伪错误):原假设H0不真(批产品质量是不合格的),但由于抽样的随机性(抽到过少的不合格品),样本落在W外,从而导致接受H0(根据样本的情况把批质量判断为合格)。其发生的概率记为β。β控制的其实是使用方的风险,控制的是使用方所承担的接受质量不合格批的风险。
  再回到刚刚计算的上例的情况,α由0.05变化为0.01,我们对批质量不合格的判断由50 个样本中出现4个不合格变化为5个,批质量是合格的而不被接受的风险就小了,犯第一类错误的风险小了,也就是生产方的风险小了;但同时随着α的减小对批质量不合格的判断条件其实放宽了——50个样本中出现4个不合格变化为5个,批质量是不合格的而被接受的风险大了;犯第二类错误的风险大了,也就是使用方的风险大了。
在相同样本量下,要使α小,必导致β大;要使β小,必导致α大,要同时兼顾生产方和使用方的风险是不可能的。要使α、β皆小,只有增大样本量,这又增加了。
  因此综上所述,假设检验可以告诉我们如何科学地进行质量合格判定,又告诉我们要兼顾生产方和使用方的质量风险,同时考虑质量和成本的问题。
孙厉.假设检验在卷烟质量判断中的应用
本条目对我有帮助152
&&如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请。
本条目相关文档
& 70页& 6页& 31页& 32页& 57页& 16页& 205页& 101页& 22页& 96页
本条目由以下用户参与贡献
(window.slotbydup=window.slotbydup || []).push({
id: '224685',
container: s,
size: '728,90',
display: 'inlay-fix'
评论(共22条)提示:评论内容为网友针对条目"假设检验"展开的讨论,与本站观点立场无关。
发表评论请文明上网,理性发言并遵守有关规定。
以上内容根据网友推荐自动排序生成显著性水平是针对假设检验而言的,它给出了检验决策时拒绝或不拒绝原假设的标准,而假设检验是统计推论的一种。&在这里我先复述一下区间估计中置信水平的确切含义, 并将此含义做一个引申将有助于您的理解。当总体均值为m时, 样本均值x ?有一个相应的抽样分布。设x ?落在m周围d范围内的概率为0.95 , 由于随机事件m-d≤x ?≤m+d等于随机事件x ?-d≤m≤x ?+d, 所以m距离x ?不超过d的概率为0.95 ,也就是P(x ?-d≤m≤x ?+d)=P(m-d≤x ?≤m+d)=0.95 。于是, 我们可以利用任何一个抽样结果x ?做出区间估计:在0.95 置信水平上, m落在置信区间〔x ?-d,x ?+d〕内。在这里, 置信水平0.95 是指我们所采用的这种区间估计的方法正确的可能是0.95 ;即如果我们以一个样本均值x ?为中心, 以d为半径划一个区间, 并指出总体均值m将落在这个置信区间〔x ?-d,x ?+d〕内, 那么这种推论总体的断言方式产生错误结论的概率为1 -0.95 =0.05 。你要搞清楚,置信水平这个概率并不是用于描述在一个抽样之后已经获得的具体结论,因为一个由区间估计产生的具体推论是由一个已获得的样本均值x ?形成, 这个结论要么正确、要么错误, 无所谓概率可言,而是基于数次随机抽样之后依据样本均值x ?断言总体均值?落在置信区间〔x ?-d,x ?+d〕内。用频率的角度理解概率, 那么在0.95 置信水平上m的置信区间为〔x ?-d,x ?+d〕就是指, 由于每100 次抽样和区间估计中会有约95 次抽样的结果满足m-d≤x ?≤m+d, 所以由这约95 次抽样所做出的区间估计, 也就是会有约95 次区间估计x ?-d≤m≤x ?+d将是正确的。(参考:;卢淑华:《社会统计学》, 北京大学出版社1989 年版, 第242 -245 页, 第248 -250 页)这里顺便说下假设检验过程中可能出现的决策错误吧!第一类就是所谓拒真错误,第二类称采伪错误。拒真错误就是指按照假设检验的决策原则,拒绝了一个本来是真实的原假设。原假设本来是真实的,但由于样本的随机性,检验统计量的值却落入了拒绝域,按照决策规则拒绝原假设,此时便犯了拒真错误。显然,犯拒真错误的概率就是显著性水平a,所以犯拒真错误的概率是可控的。事先给定的显著性水平越小,犯拒真错误的可能性越小;事先给定的显著性水平越大,犯拒真错误的可能性越大。拒真错误是指按照假设检验的决策原则,接受了一个本来是假的原假设。原假设本来是假的,但检验统计量却落入了在这个假的前提下所构造出来的接受域,按照决策规则,没有理由拒绝原假设,此时便犯了采伪错误。有一点还要注意,犯采伪错误的概率当然不是1-a,而是在检验统计量的真实分布下,由接受域所规定的概率,一般记做b由此可见,一个假设检验过程可能有四种可能的决策结果,列在下面的表中:&没有拒绝原假设拒绝原假设原假设为真正确决策(1-a)拒真概率a原假设为假采伪错误b正确决策(1-b)在样本容量给定的情况下,最容易控制的是拒真错误的概率,即显著水平为a。因此,在实践中为了避免后果比较严重的决策错误发生,大家都遵循一个共同的原则,即在原假设的表述上,将最值得关心的问题作为原假设提出来,从而使后果较严重的错误落在拒真错误上,控制其发生的概率,这也就是显著性水平的意义所在。显著性水平是针对假设检验而言的,它给出了检验决策时拒绝或不拒绝原假设的标准,而假设检验是统计推论的一种。&在这里我先复述一下区间估计中置信水平的确切含义, 并将此含义做一个引申将有助于您的理解。当总体均值为m时, 样本均值x ?有一个相应的抽样分布。设x ?落在m周围d范围内的概率为0.95 , 由于随机事件m-d≤x ?≤m+d等于随机事件x ?-d≤m≤x ?+d, 所以m距离x ?不超过d的概率为0.95 ,也就是P(x ?-d≤m≤x ?+d)=P(m-d≤x ?≤m+d)=0.95 。于是, 我们可以利用任何一个抽样结果x ?做出区间估计:在0.95 置信水平上, m落在置信区间〔x ?-d,x ?+d〕内。在这里, 置信水平0.95 是指我们所采用的这种区间估计的方法正确的可能是0.95 ;即如果我们以一个样本均值x ?为中心, 以d为半径划一个区间, 并指出总体均值m将落在这个置信区间〔x ?-d,x ?+d〕内, 那么这种推论总体的断言方式产生错误结论的概率为1 -0.95 =0.05 。你要搞清楚,置信水平这个概率并不是用于描述在一个抽样之后已经获得的具体结论,因为一个由区间估计产生的具体推论是由一个已获得的样本均值x ?形成, 这个结论要么正确、要么错误, 无所谓概率可言,而是基于数次随机抽样之后依据样本均值x ?断言总体均值?落在置信区间〔x ?-d,x ?+d〕内。用频率的角度理解概率, 那么在0.95 置信水平上m的置信区间为〔x ?-d,x ?+d〕就是指, 由于每100 次抽样和区间估计中会有约95 次抽样的结果满足m-d≤x ?≤m+d, 所以由这约95 次抽样所做出的区间估计, 也就是会有约95 次区间估计x ?-d≤m≤x ?+d将是正确的。(参考:;卢淑华:《社会统计学》, 北京大学出版社1989 年版, 第242 -245 页, 第248 -250 页)这里顺便说下假设检验过程中可能出现的决策错误吧!第一类就是所谓拒真错误,第二类称采伪错误。拒真错误就是指按照假设检验的决策原则,拒绝了一个本来是真实的原假设。原假设本来是真实的,但由于样本的随机性,检验统计量的值却落入了拒绝域,按照决策规则拒绝原假设,此时便犯了拒真错误。显然,犯拒真错误的概率就是显著性水平a,所以犯拒真错误的概率是可控的。事先给定的显著性水平越小,犯拒真错误的可能性越小;事先给定的显著性水平越大,犯拒真错误的可能性越大。拒真错误是指按照假设检验的决策原则,接受了一个本来是假的原假设。原假设本来是假的,但检验统计量却落入了在这个假的前提下所构造出来的接受域,按照决策规则,没有理由拒绝原假设,此时便犯了采伪错误。有一点还要注意,犯采伪错误的概率当然不是1-a,而是在检验统计量的真实分布下,由接受域所规定的概率,一般记做b由此可见,一个假设检验过程可能有四种可能的决策结果,列在下面的表中:&没有拒绝原假设拒绝原假设原假设为真正确决策(1-a)拒真概率a原假设为假采伪错误b正确决策(1-b)在样本容量给定的情况下,最容易控制的是拒真错误的概率,即显著水平为a。因此,在实践中为了避免后果比较严重的决策错误发生,大家都遵循一个共同的原则,即在原假设的表述上,将最值得关心的问题作为原假设提出来,从而使后果较严重的错误落在拒真错误上,控制其发生的概率,这也就是显著性水平的意义所在。
就是一个事先假定的一个可以犯第一类错误的最大概率,第一类错误就是指零假设是正确的却通过假设检验而拒绝了本来正确的零假设。为避免这一重大错误而事先对此认为地设定了一个概率,如果在检验中发现p值小于这个设定值,即发生此实验结果及更极端的结果(即更偏离零假设预测情况的事件)的概率总和小于此预先设定值,则我们有理由认为这个实验结果是小概率事件,我们有充分理由拒绝零假设。
所以一般来说,设定了显著水平,是为了跟之后得出的p值进行比较,确定实验所得结果是否为小概率事件,由此作出统计判断。
就是一个事先假定的一个可以犯第一类错误的最大概率,第一类错误就是指零假设是正确的却通过假设检验而拒绝了本来正确的零假设。为避免这一重大错误而事先对此认为地设定了一个概率,如果在检验中发现p值小于这个设定值,即发生此实验结果及更极端的结果(即更偏离零假设预测情况的事件)的概率总和小于此预先设定值,则我们有理由认为这个实验结果是小概率事件,我们有充分理由拒绝零假设。
所以一般来说,设定了显著水平,是为了跟之后得出的p值进行比较,确定实验所得结果是否为小概率事件,由此作出统计判断。
假设检验有两种结果,接受原假设和拒绝原假设。假设检验可能会出现两种错误。一种是原假设是对的,你却拒绝了原假设,这个是Type 1 ;一种是原假设是对的,你接受了原假设,这个是Type 2. Type 1发生的概率就是α,也就是你所问的显著性水平( level of significance) Type 2 发生的概率是β(β risk)。(1-α)叫做可靠系数(confidencecoefficient), 其实顾名思义嘛,α是拒绝正确原假设的概率,(1-α)就是接受正确的原假设的概率~& 所以假设检验结果有四种可能,第一原假设本来是正确的,你拒绝了原假设, Type 1 ,概率α。第二原假设本来正确的,你接受了原假设,(1-α)。第三原假设是错误的,你接受了,β。第四原假设是错误的,你拒绝了,(1-β)。α越小,β越大。α可取单尾也可取双尾,是根据检验要求自己确定的,一般选α=0.01或0.05,意思就是当你做出接受原假设的决定时,正确率是99%或95%。α用于Z检验:举个例子吧~选定α=0.05,按照Z检验的步骤,双尾图像对称,两边都是0.025,查Z表得到critical value, (Z start)若Z start &critical value,拒绝原假设。如果方差不已知,Z检验换成t 检验。用于假设检验中的P value(P值检验),P是拒绝原假设的最小显著性水平,P和α有密切的关系。如果α&P,则显著性水平α下拒绝假设;如果α&P,则显著性水平α不拒绝原假设。α=P时,,统计量的值刚好等于水平临界值,需增加样本容量,重新进行抽样检验。我也是才学的这里呢~觉得还蛮实用哒~~不懂可以再问我呀~~欢迎交流~~假设检验有两种结果,接受原假设和拒绝原假设。假设检验可能会出现两种错误。一种是原假设是对的,你却拒绝了原假设,这个是Type 1 ;一种是原假设是对的,你接受了原假设,这个是Type 2. Type 1发生的概率就是α,也就是你所问的显著性水平( level of significance) Type 2 发生的概率是β(β risk)。(1-α)叫做可靠系数(confidencecoefficient), 其实顾名思义嘛,α是拒绝正确原假设的概率,(1-α)就是接受正确的原假设的概率~& 所以假设检验结果有四种可能,第一原假设本来是正确的,你拒绝了原假设, Type 1 ,概率α。第二原假设本来正确的,你接受了原假设,(1-α)。第三原假设是错误的,你接受了,β。第四原假设是错误的,你拒绝了,(1-β)。α越小,β越大。α可取单尾也可取双尾,是根据检验要求自己确定的,一般选α=0.01或0.05,意思就是当你做出接受原假设的决定时,正确率是99%或95%。α用于Z检验:举个例子吧~选定α=0.05,按照Z检验的步骤,双尾图像对称,两边都是0.025,查Z表得到critical value, (Z start)若Z start &critical value,拒绝原假设。如果方差不已知,Z检验换成t 检验。用于假设检验中的P value(P值检验),P是拒绝原假设的最小显著性水平,P和α有密切的关系。如果α&P,则显著性水平α下拒绝假设;如果α&P,则显著性水平α不拒绝原假设。α=P时,,统计量的值刚好等于水平临界值,需增加样本容量,重新进行抽样检验。我也是才学的这里呢~觉得还蛮实用哒~~不懂可以再问我呀~~欢迎交流~~
显著性水平是人们事先指定的犯第Ⅰ类错误的最大允许值.显著性水平越小,犯第一类错误的可能性自然就越小,但犯第二类错误的可能性则随之增大。
确定了显著性水平就等于控制了犯第Ⅰ类错误的概率,即我们在拒绝原假设时,只规定了犯第Ⅰ类错误的概率不超过给定的显著性水平,但对于犯第二类错误的概率β我们却无法确定。
显著性水平是人们事先指定的犯第Ⅰ类错误的最大允许值.显著性水平越小,犯第一类错误的可能性自然就越小,但犯第二类错误的可能性则随之增大。
确定了显著性水平就等于控制了犯第Ⅰ类错误的概率,即我们在拒绝原假设时,只规定了犯第Ⅰ类错误的概率不超过给定的显著性水平,但对于犯第二类错误的概率β我们却无法确定。
&&&&&&&我再港学习数理统计的时候对于理解第一类错误和第二类错误也遇到了这样的难题。要回答这个问题,首先要理解一个假设检验中很显而易见的一个要点:原假设H0和备择假设H1他们的地位是不平等的。相当与法院必须先假设对方无罪,除非有足够的证据,否则不能改变原假设。&&&&&& 而统计中的足够的证据是什么呢?在原假设下,你研究的对象会产生一个分布,我们会取一个截断(截断内发生的概率较大,截断外发生的概率较小),从而产生一个范围,如果样本值在这个范围中,就不改变原假设,如果样本值太奇怪,在这个原假设下是一个小概率事件(比如0.001)我们就放弃原假设&&选择备择假设。&&&&& 例如:H0:u=0;H1:u=1;(方差等于1),x(样本均值)&&&&& &首先我们应当计算在原假设下,& 我们取的截断点应该在哪里(这个取a=0.05),如果x服从原假设,那么x应该再u=0的附近变化,即|x-u|&c。因为a=0.05,所以得到c=u0.025(标准正态分布分位数分位数),如果x在(u0.025,u0.9975)之间,那么我们不放弃原假设,如果在区间之外,我们则选择备择假设。&&&&&& 也就是说,显著度可以理解为:放弃原假设,我们犯弃真错误的概率是多大。&&&&&&&我再港学习数理统计的时候对于理解第一类错误和第二类错误也遇到了这样的难题。要回答这个问题,首先要理解一个假设检验中很显而易见的一个要点:原假设H0和备择假设H1他们的地位是不平等的。相当与法院必须先假设对方无罪,除非有足够的证据,否则不能改变原假设。&&&&&& 而统计中的足够的证据是什么呢?在原假设下,你研究的对象会产生一个分布,我们会取一个截断(截断内发生的概率较大,截断外发生的概率较小),从而产生一个范围,如果样本值在这个范围中,就不改变原假设,如果样本值太奇怪,在这个原假设下是一个小概率事件(比如0.001)我们就放弃原假设&&选择备择假设。&&&&& 例如:H0:u=0;H1:u=1;(方差等于1),x(样本均值)&&&&& &首先我们应当计算在原假设下,& 我们取的截断点应该在哪里(这个取a=0.05),如果x服从原假设,那么x应该再u=0的附近变化,即|x-u|&c。因为a=0.05,所以得到c=u0.025(标准正态分布分位数分位数),如果x在(u0.025,u0.9975)之间,那么我们不放弃原假设,如果在区间之外,我们则选择备择假设。&&&&&& 也就是说,显著度可以理解为:放弃原假设,我们犯弃真错误的概率是多大。
惊破霓裳羽衣曲假设检验中,人为设定的一个可以接受的原假设因纯粹偶然原因而发生的概率。这是我能想到的最粗暴简单的解释。。意义嘛。。。就是为了强行解释随机性,把随机的事件在一定范畴内变得有理可循。。。假设检验中,人为设定的一个可以接受的原假设因纯粹偶然原因而发生的概率。这是我能想到的最粗暴简单的解释。。意义嘛。。。就是为了强行解释随机性,把随机的事件在一定范畴内变得有理可循。。。在假设检验中,否定或接受无效假设的依据是小概率事件实际不可能性原理。用来确定否定或接受无效假设的概率标准叫显著水平(significance level)在假设检验中,否定或接受无效假设的依据是小概率事件实际不可能性原理。用来确定否定或接受无效假设的概率标准叫显著水平(significance level)因为什么事情都不是绝对的,显著性水平就是统计假设中犯一型错误的概率,显著性水平越大,原假设为真却被拒绝的概率越大,降低显著性水平就能减少这种可能性。因为什么事情都不是绝对的,显著性水平就是统计假设中犯一型错误的概率,显著性水平越大,原假设为真却被拒绝的概率越大,降低显著性水平就能减少这种可能性。
后可以回答该问题
相关标签:
相关标签:
关注我们咨询服务合作法律法规京ICP备号
下载申请方APP
即刻拥有你的学业规划助手}

我要回帖

更多关于 统计假设检验基本步骤 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信