卡方分布的值都是正的,为什么会有双侧t分布检验检验,双侧t分布检验检验

出自 MBA智库百科()
卡方检验(Chi-square test/Chi-Square Goodness-of-Fit Test)
  卡方检验是一种用途很广的计数资料的方法。它属于的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。
  它在分类资料中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的等。
  卡方检验是以&2分布为基础的一种常用假设检验方法,它的无效假设H0是:观察频数与期望频数没有差别。
  该检验的基本思想是:首先假设H0成立,基于此前提计算出&2值,它表示观察值与理论值之间的偏离程度。根据&2分布及自由度可以确定在H0假设成立的情况下获得当前统计量及更极端情况的P。如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有;否则就不能拒绝无效假设,尚不能认为所代表的实际情况和理论假设有差别。
  &2值表示观察值与理论值之问的偏离程度。计算这种偏离程度的基本思路如下。
  (1)设A代表某个类别的观察频数,E代表基于H0计算出的期望频数,A与E之差称为残差。
  (2)显然,残差可以表示某一个类别观察值和理论值的偏离程度,但如果将残差简单相加以表示各类别观察频数与期望频数的差别,则有一定的不足之处。因为残差有正有负,相加后会彼此,总和仍然为0,为此可以将残差平方后求和。
  (3)另一方面,残差大小是一个相对的概念,相对于期望频数为10时,期望频数为20的残差非常大,但相对于期望频数为1 000时20的残差就很小了。考虑到这一点,人们又将残差平方除以期望频数再求和,以估计观察频数与期望频数的差别。
  进行上述操作之后,就得到了常用的&2统计量,由于它最初是由英国统计学家在1900年首次提出的,因此也称之为Pearson &2,其计算公式为  (i=1,2,3,…,k)
  其中,Ai为i水平的观察频数,Ei为i水平的期望频数,n为总频数,pi为i水平的期望频率。i水平的期望频数Ei等于总频数n×i水平的期望概率pi,k为单元格数。当n比较大时,&2统计量近似服从k-1(计算Ei时用到的参数个数)个自由度的。
  作为学术界的领袖,Pearson先生当初发表在《哲学杂志》上的&2论文题目为:On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling.
  由卡方的计算公式可知,当观察频数与期望频数完全一致时,&2值为0;观察频数与期望频数越接近,两者之间的差异越小,&2值越小;反之,观察频数与期望频数差别越大,两者之间的差异越大,&2值越大。换言之,大的&2值表明观察频数远离期望频数,即表明远离假设。小的&2值表明观察频数接近期望频数,接近假设。因此,&2是观察频数与期望频数之间距离的一种度量指标,也是假设成立与否的度量指标。如果&2值“小”,研究者就倾向于不拒绝H0;如果&2值大,就倾向于拒绝H0。至于&2在每个具体研究中究竟要大到什么程度才能拒绝H0,则要借助于卡方分布求出所对应的P值来确定。
  卡方分布本身是连续型分布,但是在分类资料的统计分析中,显然频数只能以整数形式出现,因此计算出的统计量是非连续的。只有当样本量比较充足时,才可以忽略两者问的差异,否则将可能导致较大的偏差具体而言,一般认为对于卡方检验中的每一个单元格,要求其最小期望频数均大于1,且至少有4/5的单元格期望频数大于5,此时使用卡方分布计算出的概率值才是准确的。如果数据不符合要求,可以采用确切概率法进行概率的计算。
  1、四格表资料的卡方检验
  四格表资料的卡方检验用于进行两个率或两个构成比的比较。
  1)专用公式:
  若四格表资料四个格子的分别为a,b,c,d,则四格表资料卡方检验的卡方值=,自由度v=(行数-1)(列数-1)
  2)应用条件:
  要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率。
  2、行×列表资料的卡方检验
  行×列表资料的卡方检验用于多个率或多个构成比的比较。
  1)专用公式:
  r行c列表资料卡方检验的卡方值=
  2)应用条件:
  要求每个格子中的理论频数T均大于5或1&T&5的格子数不超过总格子数的1/5。当有T&1或1&T&5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行×列表资料卡方检验的应用条件。而多个率的两两比较可采用行×列表分割的办法。
  3、列联表资料的卡方检验
  同一组对象,观察每一个个体对两种分类方法的表现,结果构成双向交叉排列的就是列联表。
  1)R×C 列联表的卡方检验:
  R×C 列联表的卡方检验用于R×C列联表的相关分析,卡方值的计算和检验过程与行×列表资料的卡方检验相同。
  2)2×2列联表的卡方检验:
  2×2列联表的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。当用一般四格表的卡方检验计算时,卡方值=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d),此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值=( | b & c |
& 1)2/(b+c)时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。
  列联表卡方检验应用中的注意事项同R×C表的卡方检验相同。
  卡方检验最常见的用途就是考察某无序分类变量各水平在两组或多组间的分布是否一致实际上,除了这个用途之外.膏方检验还有更广泛的应用。具体而言,其用途主要包括以下几个方面:
  (1)检验某个连续变量的分布是否与某种理论分布相一致。如是否符合正态分布、是否服从均匀分布、是否服从等。
  (2)检验某个分类变量各类的出现概率是否等于指定概率。如在36选7的彩票抽奖中,每个数字出现的概率是否各为1/36;时,正反两面出现的概率是否均为0.5。
  (3)检验某两个分类变量是否相互独立。如吸烟(二分类变量:是、否)是否与呼吸道疾病(二分类变量:是、否)有关;产品原料种类(多分类变量)是否与产品合格(二分类变量)有关。
  (4)检验控制某种或某几种分类因素的作用以后,另两个分类变量是否相互独立。如在上例中,控制性别、年龄因素影响以后,吸烟是否和呼吸道疾病有关;控制产品加工工艺的影响后,产品原料类别是否与产品合格有关。
  (5)检验某两种方法的结果是否一致。如采用两种诊断方法对同一批人进行诊断,其诊断结果是否一致;采用两种方法对进行价值类别预测,预测结果是否一致。
  适用于四格表应用条件:
  1)随机样本数据。两个独立样本比较可以分以下3种情况:
  (1)所有的理论数T≥5并且总样本量n≥40,用Pearson卡方进行检验。
  (2)如果理论数T<5但T≥1,并且1≥40,用连续性校正的卡方进行检验。
  (3)如果有理论数T<1或n<40,则用Fisher’s检验。
  2)卡方检验的理论频数不能太小。
  R×C表卡方检验应用条件:
  (1)R×C表中理论数小于5的格子不能超过1/5;
  (2)不能有小于1的理论数。如果实验中有不符合R×C表的卡方检验,可以通过增加样本数、列合并来实现。
  1.应用实例——适合度检验
  实际执行多项式试验而得到的观察次数,与虚无假设的期望次数相比较,称为卡方适度检验,即在于检验二者接近的程度,利用样本数据以检验总体分布是否为某一特定分布的。这里以掷骰子为例介绍适度检验的方法。
  【例1】
  (1)假设掷一骰子120次,各点数共出现次数为a,b为各点数出现的120×1/6=20,建立工作表文件,如图1所示。
  (2)设置H0:观察分布等于期望分布。
  (3)计算卡方检验统计量,如图2所示。
  D2=(B2-C2)^2/C2
  D8=SUM(D2:D7)
  (4)确定自由度,(6-1)×(2-1)=5;选择α=0.05。
  (5)利用Excel提供的CHIINV函数求临界值,在D9单元格中键入“=CHIINV(0.05,5)”按回车键,得临界值11.07。
  (6)比较临界值和统计量,11.07&2.3,即临界值大于统计量,故差异不显著,接受H0。
  2.应用实例2——独立性检验
  卡方独立性检验是用来检验两个属性间是否独立。一个变量作为行,另一个变量作为列。下面一例便是介绍卡方独立性检验的方法。
  【例2】某机构欲了解现在性别与收入是否有关,他们500人,询问对此的看法,结果分为“有关、无关、不好说,,三种答案,图3中县调查得到的数据。
  下面是利用Excel解决此问题的步骤。
  (1)零假设H0:性别与无关。
  (2)确定自由度为(3-1)×(2-1)=2,选择显著水平α=0.05。
  (3)求解男女对收入与性别相关不同看法的期望次数,这里采用所在行列的合计值的乘机除以总计值来计算每一个期望值,如图4所示,在单元格B9中键入“=B5*E3/E5”,同理(第一个等于号理解为在单元格中键入):
B10=“=B5*E4/E5,
C9=“=C5*E3/E5”,
C10=“=C5*E4/E5”,
D9=“=D5*E3/E5”,
D10=“=D5*E4/E5”。
  (4)利用卡方统计量计算公式计算统计量,在单元格B15中键入“=(B3-B9)^2/B9”,其余单元格依次类推,结果如图5所示。
  (5)利用Excel提供的CHIINV函数计算显著水平为0.05,自由度为2的临界值,在Excel单元格中键入“=CHIINV(0.05,2)”按回车键,得临界值为5.9915。
  (6)比较统计量度和临界值,统计量14.32483大于临界值5.9915,故拒绝零假设。
  3.应用实例3——统一性检验
  检验两个或两个以上总体的某一特性分布,也就是各“类别”的是否统一或相近,一般称为卡方统一性检验或者卡方同质性检验。下面一例便是利用卡方统一性检验的例子。
  【倒3】某想了解南京和北京的市民对的满意程度是否相同。他们从南京抽出600居民,北京抽取600居民,每个居民对满意程度(非常满意、满意、不满意、非常不满意)任选一种,且只能选一种。将统计结果键入Excel工作表中,如图6所示。
  下面是利用Excel解决此问题的步骤。
  (1)零假设H0:南京和北京居民对最低生活保障满意程度的比例相同。
  (2)确定自由度为(4-1)×(2-1)=3,选择显著水平α=0.05。
  (3)求解卡方检验的l临界值,在Excel单元格中键入“=CHIINV(0.05,3)”,按回车键得临界值为7.81。
  (4)计算北京和南京不同满意程度的期望值,在单元格B11和C11中分别键入“=$B$7*D3/$D$7”和“=$C$7*D3/$D$7”,选中B11:C11,按住C11右下角填充,填充至C14。
  (5)计算卡方统计量,在单元格B19中键入“=(B3-B11)^2/B11”,其余单元格依次类推,结果如图7所示。
  (6)比较统计量和临界值,统计量1.3875小于临界值7.81,故接受零假设。
张文彤,邝春伟编著.第16章 无序分类变量的统计推断——卡方检验 SPSS统计分析基础教程 第2版.高等教育出版社,2011.11.
刘铁民主编.第十章 安全生产统计分析 安全生产管理知识 2006版.中国大百科全书出版社,2006年05月第1版.
卡方检验的应用条件[J].中国医药科学,2013,(第2期).
孙志刚,杨聪.第八章 假设检验 Excel在经济与数理统计中的应用.中国电力出版社,2004年01月第1版.
本条目对我有帮助314
&&如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请。
本条目相关文档
& 55页& 21页& 36页& 99页& 96页& 34页& 60页& 28页& 41页
本条目由以下用户参与贡献
,,,,,,,,,,,.
(window.slotbydup=window.slotbydup || []).push({
id: '224685',
container: s,
size: '728,90',
display: 'inlay-fix'
评论(共29条)提示:评论内容为网友针对条目"卡方检验"展开的讨论,与本站观点立场无关。
发表评论请文明上网,理性发言并遵守有关规定。
以上内容根据网友推荐自动排序生成当前位置: >>
第九章[教学要求] 教学要求]χ 2 检验掌握: 掌握:单个样本分布的拟合优度检验;独立样本 2×2 列联表资料的χ2 检验;独 立样本 R ×C 列联表资料的χ2 检验;配对 2×2 列联表资料的 χ2 检验。 熟悉: 熟悉:配对R × R列联表资料的χ2检验;四格表资料的Fisher确切概率法。 了解: 了解:连续型随机变量的χ2 分布;分类数据 χ2 检验的基本思想。 [重点难点 重点难点] 重点难点第一节 χ 2 分布和拟合优度检验一、χ 分布2基本概念: 基本概念:χ2 分布是一种连续型随机变量的概率分布,如果 Z1 , Z 2 , L , Zν 是 v 个相互独立的标准正态分布随机变量, Z12 + Z 22 + L + Zν2 的分布称为服从自由 则 度为ν 的χ2 分布。 χ 2 分布的概率密度曲线的形状依赖于自由度ν 的大小。 检验的基本思想 二、拟合优度χ2 检验的基本思想 拟合优度检验是根据样本的频率分布检验其总体分布是否符合某给定的理 论分布。 χ 2 值反映了样本实际频率分布与理论分布的符合程度。 检验的基本公式 三、χ2 检验的基本公式 大样本时检验统计量χ2 = ∑i =1k( Ai ? Ti ) 2 Ti近似地服从χ2 分布,自由度为ν = k-1-(计算 Ti 时利用样本资料估计的参数个数)其中,Ai 和 Ti 分别为实际观察频数和 H 0 成立时的理论频数,k 为频数分布的类 别总数。四、拟合优度χ 检验注意事项21.分组不同拟合的结果可能不同,一般要求分组时每组中的理论频数不小 于 5。 2.需要有足够的样本含量,如果样本含量不大,需要经连续性校正,校正 的公式为χ2 = ∑i =1k( Ai ? Ti ? 0.5) 2 Ti第二节 独立样本 2×2 列联表资料的χ2 检验 × 列联表资料的一、2×2 列联表资料 χ2 检验目的 × 列联表资料 两独立样本率差异的比较。即根据两独立样本的频率分布,检验两个样本的 总体分布是否相同。 二、统计量计算公式 可直接使用χ2 检验基本公式也可使用等价的专用公式或校正公式。 专用公式χ2 =校正公式(ad ?bc)2 n (a +b)(c + d)(a +c)(b + d)χ2 =自由度ν =1。(| ad ? bc | ?n / 2) 2 n (a + b)(c + d )( a + c)(b + d )三、2×2 列联表资料χ2 检验的注意事项 × 列联表资料1.使用专用公式要求:n 不小于 40,T 不小于 5; 2.在 n≥40 时,如果有某个格子出现 1≤T&5,需用校正公式; 3.当 n <40 或 T <1 时,用 Fisher 确切概率法检验。列联表资料的 第三节 独立样本 R ×C 列联表资料的χ2 检验一、R×C 列联表资料 χ2 检验目的 × 列联表资料1.多个独立样本率的比较:根据 R 个独立样本的频率分布,检验 R 个二项分布总体的概率是否相同。2.多个独立样本频率分布的比较:根据 R 个独立样本的频率分布,检验 R 个总体分布是否相同。 二、统计量计算公式 统计量计算公式 计算χ = n(∑∑2 i =1 j =1RC2 Aijni m j? 1)自由度 ν =(R-1) (C-1) 三、R×C 列联表资料χ2 检验的注意事项 × 列联表资料 检验的 1.对于多个率或频率分布比较的χ2 检验,结论为拒绝 H 0 时,仅表示多组之 间有差别,并不是任 2 组之间都有差别。若要明确哪两组间不同,还需进一步作 多组间的两两比较; 2.R×C 列联表χ2 检验要求理论频数不宜太小,一般不宜有 1/5 以上的格子 的理论频数小于 5,或有一个理论频数小于 1; 3.χ2 检验不适用于有序分类资料的比较分析。配对设计资料的χ 第四节 配对设计资料的χ2 检验一、配对 2×2 列联表资料的 χ2 检验 × 列联表资料的 1. 配对 2×2 列联表资料 χ2 检验目的:通过配对设计的两样本资料来推断 两方法的阳性概率有无差别。 2.统计量计算公式 当 b + c ≥ 40 时, (b ? c) 2 χ = b+c2ν =1当 b + c & 40 时,需对公式进行校正, 校正公式为χ2 =(| b ? c | ?1) 2 b+c资料的 二、配对 R×R 列联表资料的 χ2 检验 × 列联表资料 1.配对 R×R 列联表资料 χ2 检验目的:通过样本资料来推断两个变量的总 体概率分布是否相同。 2.统计量计算公式 T = 自由度ν = k ? 1 。k ? 1 k ( ni ? mi ) 2 ∑ k i =1 ni + mi ? 2 Aii第五节 2×2 列联表资料的确切概率法 ×(一)当 2×2 列联表资料出现以下情况时,需用确切概率法直接计算概率 以作判断: ①样本含量 n & 40; ②理论频数 T&1; ③χ2 检验后所得概率 P 接近检验水准α。 (二)确切概率计算法的基本思想和步骤 1.在四格表边缘合计固定不变的条件下,计算表内 4 个实际频数变动时的 各种组合的概率 PiPi =( a + b ) !( c + d )!( a + c )!( b + d )!a !b !c ! d ! n !式中 a、b、c、d 为四格表中的四个频数,n 为总例数,其和 ∑ Pi = 1 。2. 按检验假设计算单侧或双侧的累计概率 P。 3.把 P 值与检验水准α 比较,做出是否拒绝 H0 的结论。第七节 案例讨论案例 9-1 某地对区级医院
年医疗质量进行总体评价与比较,按 分层抽样方法抽取两年内某病患者 1250 例, 2001 和 2002 两年间患者年龄构成 与病情的差别没有统计学意义,评价的三项指标分别为疗效、住院日、费用。规 定很好、 一般、 好、 差的标准见表 9-14, 病人医疗质量各等级频数分布见表 9-15。表 9-14 指标 很好 很好、好、一般、差的标准 好 一般 差 疗效 住院日 费用(元)治愈 ≤15 ≤1400 表 9- 15显效 16~20 好转 21~25 无效& 25 &2200两年病人按医疗质量等级的频数分配表 很好 160 170 好 380 410 一般 20 10 差 40 60指标 疗效年份 01 年 02 年01 年 住院日 02 年180 200250 310130 12040 2001 年 费用 02 年130 110270 320130 12070 100用 χ 2 检验分别对疗效、住院日、费用三项指标的分布做两年之间的比较, 结果为 疗效χ 2 =6.786P = 0.079 P = 0.006 P = 0.020住院日 χ 2 =12.568 费用χ 2 = 9.613故不能认为两年的疗效不同;而两年的住院日和费用的差别均有统计学意 义。根据调查所得平均住院日和平均费用可以认为平均住院日 2001 年比 2002 年长,而费用 2001 年低于 2002 年。 请讨论以上检验方法是否正确?如果不正确,问题出在什么地方? 案例 9-2 某研究对 140 名乙型肝炎患者和 HBsAg 携带者的唾液中乙肝病毒的前 S1 抗原与 HBsAg、HBeAg 和前 S2 抗原检出率进行差别分析,见表 9-16。表9-16 唾液中乙肝病毒的前S1抗原与HBsAg、HBeAg和前S2抗原的关系比较前S1指标χ2P + + HBsAg + HBeAg + 前S2 10 11 21 0 20 3155 53.02 54 3 4.57 106 2 5.33 107 &0.050 &0.050 &0.005(| b ? c | ?1) 2 = 其中,前S1 抗原与HBsAg比较: χ = b+c2(55 ? 0 ? 1 ) 55 + 02= 53.02(b ? c) 2 前S1 抗原与HBeAg比较: χ = = b+c2( 3 ? 11 )3 + 112= 4.57(b ? c)2 前S1 抗原与前S2抗原比较: χ = = b+c2(2 ? 10 2 + 10)2= 5.33以上三个 χ2 值对应的 P 值见表 9-16 ,请讨论以上检验方法是否正确?[案例讨论参考答案] 案例讨论参考答案]案例 9-1 原检验方法不正确。 该例疗效、住院日、费用均按规定划分为很好、好、一般、差四个等级,根 据要求比较两年各指标的总体差异,如果用 χ 2 检验只能推断每个指标两年不同 等级的频率分布是否有差别, 而频率分布有差别不能代表两年该指标的总体水平 有差别。 案例 9-2 原检验方法不正确。 1.前 S1 抗原与 HBsAg 比较:因为 b+c = 55 & 40,可不校正,但原方法却 进行了校正。不校正时χ2 值为 55,P&0.005。 2.前 S1 抗原与 HBeAg 比较:因为 b+c = 14 & 40,一定要校正,但原方法 却没有校正。校正后χ2 值为 3.5,P&0.05,校正后得出的结论与原方法得出的结 论相反。 3.前 S1 抗原与前 S2 抗原比较:因为 b+ c= 12 & 40,一定要校正,但原方 法却没有校正。校正后χ 2 值为 4.08,P&0.05。思考与练习一、简答题 1.简述本章 χ2 检验的用途。 2.比较两个独立样本频率分布的χ2 检验,和比较两个配对样本频率分布的χ2 检验在设计方法、资料整理、假设检验等方面的差别是什么?3.如果实验效应用等级资料表示,欲比较两组总体效应间差别是否有统计 学意义,为什么不能用 χ2 检验?试举例说明。 4.为什么有些四格表(或 R×C 表)必须要计算确切概率? 二、分析与计算题 1.某医院收治 186 例重症乙型脑炎患者,随机分成两组,分别用同样的方 剂治疗,但其中一组加一定量的人工牛黄,治疗结果如表 9-17 所示。表 9-17 加人工牛黄治疗乙型脑炎效果 治疗效果 疗 法 治愈 不加人工牛黄 加人工牛黄 合计 26 68 94 未愈 45 47 92 71 115 186 合计问加人工牛黄是否增加该方剂的疗效? 2.某研究人员观察了其他基本情况相似的 60 岁以上老人 126 名,其中患冠 心病的 52 名,未患冠心病的 74 名,询问他们食盐的情况,其结果见表 9-18。表 9-18 冠心病 超标 有 无 合计 36 42 78 未超标 16 32 48 52 74 126 冠心病患病与食盐情况 食盐情况 合计 问患冠心病和未患冠心病的老人食盐超标的概率是否不同? 3.为比较三种方剂治疗胃溃疡的效果,将 200 名病情类似的患者随机分到 三个治疗组,疗效见表 9-19,分析三个方剂的治疗效果有无差别?表 9-19 治疗方法 有效 甲方剂 乙方剂 丙方剂 合 计 42 38 56 136 无效 18 27 19 64 60 65 75 200 三种方剂治疗胃溃疡的效果 治疗效果 合计4. 某医院比较急性黄疸型肝炎与正常人在超声波波型上的表现, 见表 9-20。 问两组肝波型的差异有无统计学意义?表 9-20 急性黄疸型肝炎与正常人的超声波波形 波 组别 正常 黄疸型肝炎组 正 常 人 组 合计 12 277 289 可疑 43 39 82 较密 232 11 243 287 327 614 型 合计5.某研究人员随机抽查 110 名早期乳腺癌患者,同时用甲乙两种简易方法 对各位患者进行检查,将检查结果整理成表 9-21 的形式。问这两种简易方法对 早期乳腺癌的检出概率有无差别?表 9-21 甲乙两种方法检查乳腺癌患者的情况 乙方法 甲方法 检出 检 出 42 30 未检出 8 30 50 60 合计未检出 合计72381106.配对比较两种方法治疗扁平足的疗效,100 对患者的疗效记录见表 9-23, 问两种方法的概率分布有无差异?表 9-23 甲法治疗结果 好 好 中 差 合计 39 0 3 42 中 3 24 4 31 差 2 8 17 27 44 32 24 100(固定值) 两种方法治疗扁平足的疗效 乙法治疗结果 合 计 [思考与练习参考答案 思考与练习参考答案] 思考与练习参考答案一、简答题 1. χ 2 检验常用于分类变量资料的统计推断。主要包括单样本的拟合优度检 验;推断两个和多个独立样本率或独立样本频率分布之间有无差别;分析配对设 计下得到的两个样本频率分布有无差异。 2.前面针对的是“两独立样本” ,行合计是事先固定的;而后者实质上是一 组样本,即使可以看成两个样本,也是 “两个互不独立的样本” ,样本含量都是n ,是固定的,而行合计与列合计却是事先不确定的。前者原始数据可以表示为教材中表 9-3 所示的四格表形式, 而后者原始数据 检验统计量, 前者用教材中公式 (9-5) (9-7) 和 , 表示为表 9-9 所示的四格表形式。 而后者用公式(9-9)和(9-10) 。 3.关键在于此时 χ 2 检验差别有统计意义,只能推断两频率分布不同,而频 率分布不同不能说明两总体平均水平不同。 4.因为只有在大样本时检验统计量χ2 = ∑i =1k( Ai ? Ti ) 2 Ti才近似地服从χ2 分布,样本含量不够大时,如果 n & 40,且 T ≥ 1 尚可以校正; 如果样本含量更小,χ2 检验就不适用了,只能计算确切概率。 二、分析与计算题 1.属于独立样本 2×2 列联表资料的χ2 检验问题,用基本公式或四格表专用 公式。χ2 =8.899, P & 0.005,加人工牛黄可以增加该方剂的疗效。 2.属于独立样本 2×2 列联表资料的χ2 检验问题,用基本公式或四格表专用 公式。χ2 =2.015, P & 0.10,不能认为患冠心病和未患冠心病的老人食盐超标的 概率不同。 3.属于独立样本 R × C 列联表资料的χ2 检验。χ2 =4.36,v =2, P & 0.05,不 能认为三个方剂的治疗效果有差异。 属于独立样本 R × C 列联表资料的χ2 检验。 R × C 表χ2 检验公式算得χ2 = 用 4. 443.456,v = 2,P&0.005,在α = 0.05 水平上拒绝 H0,两组肝波型的差异有统计 学意义。 5.属于配对 2×2 列联表资料的χ2 检验,b+c&4,需用校正公式。χ2 =11.61 P&0.005,可以认为两种方法对乳腺癌的检出概率有差别,乙法检出率高。 6.属于配对 R × R 列联表资料的χ2 检验。用公式(9-13)进行差异性分析。 算得 T=0.73,v = 4, P & 0.5 ,在α = 0.05 水平上不拒绝 H0,差异无统计学意义, 不能认为两种方法治疗结果的概率分布不相同。[补充练习题 补充练习题] 补充练习题A1 型选择题:每一道题下面有 A、B、C、D、E 五个备选答案,请从中选择一 型选择题: 、 、 、 、 五个备选答案, 个最佳答案。 个最佳答案。 1.下列不能用χ2 检验的是 A. 多个均数比较 。 B. 多个率比较 C. 多个构成比比较 E. 两个频率分布的比较 。D. 单样本分布的拟合优度检验 2.以下关于χ2 检验的自由度的说法,正确的是B.对一个 3×4 表进行检验时, ν = 11 C.对四格表检验时,ν = 42 2 D.若 χ 0.05,ν & χ 0.05, η ,则 ν & ηA.拟合优度检验时, ν = n ? 2 (n 为观察频数的个数)E.样本含量减 1 3.χ2 值的取值范围是 A. ?∞ & χ 2 & ∞ D. ?1 & χ 2 & 1。B. ?∞ & χ 2 & 0 E. χ 2 ≤ 1 C. 0 & χ 2 & ∞2 4.三个样本频率比较, χ 2 & χ 0.01, ,可以认为 2。A.各总体频率不等或不全相等 C.各样本频率均不相等 E.各总体频率相等B.各总体频率均不相等 D.各样本频率不等或不全相等 [补充练习题参考答案] 补充练习题参考答案 补充练习题参考答案1. A 2. D 3. C 4. A
卡方检验_数学_自然科学_专业资料。第 16 章 无序分类变量的统计推断――卡方检验通过前面的介绍可以知道,变量可以被分为连续性变量(定距、定比)和分类变量,...用SPSS对问卷资料进行卡方检验_计算机软件及应用_IT/计算机_专业资料。用 SPSS 对问卷资料进行卡方检验 1.调查结果如果按类别统计的人数或个数(即计数数据),有两...SPSS 中非参数检验之一:总体分布的卡方(Chi-square)检验在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形 态是否和某种特定分布相拟合。 这...检验 H0:k=0 H1:K&0 a=0.05 建立变量名: 录入数值: 统计分析: 结果分析: kappa 值=0.837 且有统计学意义,为高度一致,是否由抽样误差引起需要看卡方值...卡方检验和 F 检验的区别 卡方检验是求出两个具有频数的数据组的一致性, (注:本人认为是两个数据组的因果相关 性,P 小于 0.05 就显著相关。 ) F 检验是...SPSS学习系列24. 卡方检验_计算机软件及应用_IT/计算机_专业资料。SPSS,卡方检验,分类数据,频数 24.卡方检验 卡方检验,是针对无序分类变量的一种非参数检验,其...t检验、u检验、卡方检验、F检验、方差分析_数学_自然科学_专业资料。轻松学好统计学!今日推荐 78份文档 不小心又胖了 胖女人必看 ...频数 2.对数据加权:数据――加权个案――将“频数”选入频率变量对话框――确定 3.四个表卡方检验:分析――描述统计――交叉表――将“药物分组” 、 “是否...卡方检验_IT/计算机_专业资料。卡方检验原理,以实例说明,深入浅出 社会统计 关秉寅 第十二章 假设测定 IV:卡方测定 (The Chi Square Test) 壹、 本单元目标...(关联性分析) x2 检验 (第三节 趋势性卡方检验、第五节 等效性检验不要求) 二、习题(第三单元) 练习题:3、 4、5、6、7、8 及教材中的例题 写作业:4...
All rights reserved Powered by
copyright &copyright 。文档资料库内容来自网络,如有侵犯请联系客服。}

我要回帖

更多关于 方差分析 双侧检验 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信