展示搜集整理后的资料有哪些博物馆展示方式式

当前位置: >>
第二章统计数据的收集、整理与显示
第二章第一节 第二节 第三节 第四节统计数据的收集、整理与显示 统计数据的收集、 统计数据的收集 调查设计 统计数据整理 统计表的设计1 本章重点与学习要求重点: 重点 是了解和掌握调查设计和数据整理的方 正确使用统计图、 法;正确使用统计图、表来展示数据的特 征。 学习要求: 学习要求: 通过本章的学习, 通过本章的学习,正确理解各种调查方法 的概念、作用与特点,明确相互的区别; 的概念、作用与特点,明确相互的区别; 掌握统计数据整理的方法 ;能够正确使用 统计图表展示数据。 统计图表展示数据。 2 案例2.1 如何开展大学生上网的问卷调查 案例某大学学生工作部门想了解本校大学生上网的情况, 某大学学生工作部门想了解本校大学生上网的情况,打算采用问卷的方 匿名调查。会计学专业的李萍同学提供了如下的问卷内容: 式,匿名调查。会计学专业的李萍同学提供了如下的问卷内容: 1、你的性别( ) A、男 B、女 、你的性别( 、 、 2、你所在的年级( ) A、大一 B、大二 C、大三 D、大四 、你所在的年级( 、 、 、 、 3、你平均每天上网的时间大概是多长?( ) 、你平均每天上网的时间大概是多长?( A、1个小时以下(包括不上网)B、1~2个小时 个小时以下( 、 个小时以下 包括不上网) 、 个小时 C、2-5个小时 D、5个小时以上 、 - 个小时 、 个小时以上 4、你主要是为了什么而上网?( )(此题可多选) 此题可多选) 、你主要是为了什么而上网?( )(此题可多选 A、浏览网页 B、收发电子邮件 C、玩游戏 D、交友聊天 、 、 、 、 E、下载软件或资料 F、跟帖灌水 G、娱乐休闲 、 、 、 5、你最感兴趣的是以下哪些方面的内容?( ) 、你最感兴趣的是以下哪些方面的内容?( A、新闻时事 B、校友录 C、娱乐 D、体育 、 、 、 、 6、你认为上网与学习的关系是怎样的?( ) 、你认为上网与学习的关系是怎样的?( A、上网耽误学习 B、上网可促进学习 、 、 C、可以增强综合素质 D、其他 、 、 由这份问卷我们想知道如下的问题: 由这份问卷我们想知道如下的问题: 1.上述问卷的设计原则是什么? .上述问卷的设计原则是什么? 2.问题的设计应该注意哪些方面? .问题的设计应该注意哪些方面? 3.答案的设计应该遵循什么原则? .答案的设计应该遵循什么原则? 4.得到了资料是不是马上就可以进行分 . 析了? 析了? 第一节 统计数据的收集或次级)数据的来源 一、间接(或次级 数据的来源 间接 或次级 直接(或初级 或初级)数据的来源 二、直接 或初级 数据的来源5 一、次级统计数据的来源次级统计数据主要是从公开渠道获 得的数据,如公开出版的报纸、 得的数据,如公开出版的报纸、书籍及 相关网站中的数据, 相关网站中的数据,有些未公开的数据 在获得数据所有者允许的情况下也可以 使用。 使用。 6 刊登我国年度宏观数据的刊物主要是国家、 刊登我国年度宏观数据的刊物主要是国家、地 区和行业或部门的年鉴。例如, 中国统计年鉴》 区和行业或部门的年鉴。例如,《中国统计年鉴》、 中国统计摘要》 中国经济年鉴》 《中国统计摘要》、《中国经济年鉴》、《中国农 村统计年鉴》、《中国城市统计年鉴》、《中国社 村统计年鉴》 中国城市统计年鉴》 会统计年鉴》 中国人口统计年鉴》 会统计年鉴》、《中国人口统计年鉴》、《中国劳 动统计年鉴》 中国工业经济统计年鉴》 动统计年鉴》、《中国工业经济统计年鉴》、《中 国财政年鉴》 中国金融年鉴》以及全国各省、 国财政年鉴》、《中国金融年鉴》以及全国各省、 市、自治区、直辖市、新疆生产建设兵团的统计年 自治区、直辖市、 鉴等。 鉴等。中 国 人 口 统 计 年 鉴 中 国 市 场 统 计 年 鉴
刊登世界各国宏观数据的刊物主要由联合国统计司 )、世界银行 (UNSD)、世界银行 )、世界银行(WB)、国际货币基金组织(IMF)、 、国际货币基金组织( )、 世界贸易组织( )、世界卫生组织 )、国际 世界贸易组织(WTO)、世界卫生组织(WHO)、国际 )、世界卫生组织( )、 能源机构(IEA)、国际清算银行(BIS)、欧盟统计局 )、国际清算银行 )、欧盟统计局 能源机构( )、国际清算银行( )、 (EUROSTAT)、亚洲开发银行(ADB)、国际电信联盟 、亚洲开发银行 、国际电信联盟(ITU) 等国际性组织编制出版。有些使用面广的资料, 等国际性组织编制出版。有些使用面广的资料,在取得版 权后,由我国有关机构翻译成中文出版。例如《 权后,由我国有关机构翻译成中文出版。例如《世界经济 年鉴》 年鉴》、《世界发展报告》、《国外经济统计资料》等。 世界发展报告》 国外经济统计资料》9 选择次级数据时应该注意的问题: 选择次级数据时应该注意的问题:(1)应根据研究目的选择次级数据; )应根据研究目的选择次级数据; 含义是否发生过变化 (2)注意次级数据变量名称的含义是否发生过变化。 )注意次级数据变量名称的含义是否发生过变化。 随着历史的变迁, 随着历史的变迁,有些次级数据变量名称的内涵或 外延发生了变化,在采用数据时应该进行调整; 外延发生了变化,在采用数据时应该进行调整; (3)注意次级数据的计算口径和计算方法是否一致; )注意次级数据的计算口径和计算方法是否一致; (4)注意尊重次级数据所有者的权益。一是要合法 )注意尊重次级数据所有者的权益。 采用次级数据;二是要注明数据的来源出处, 采用次级数据;二是要注明数据的来源出处,这样 既尊重他人的劳动成果,又便于阅读者核实。 既尊重他人的劳动成果,又便于阅读者核实。 10 二、直接数据的来源初级统计数据的来源渠道主要有两个: 初级统计数据的来源渠道主要有两个: 一是专门组织的调查; 一是专门组织的调查; 普查、统计报表、抽样调查、 普查、统计报表、抽样调查、 重点调查、 重点调查、典型调查 二是科学试验。 二是科学试验。 前者是社会经济数据的主要来源, 前者是社会经济数据的主要来源,后者是 自然科学数据的主要来源 本书着重讨论取得 主要来源。 自然科学数据的主要来源。本书着重讨论取得 社会经济数据的方式和方法。 社会经济数据的方式和方法。 11 组织方式) (一) 统计调查方式 (组织方式 组织方式常用的统计调查方式主要有普查、统计报表调查、 常用的统计调查方式主要有普查、统计报表调查、抽 普查 样调查、重点调查及典型调查等 样调查、重点调查及典型调查等。1.普查(census) .普查普查是国家为了详细地了解某项重要的国情国力而专 门组织的一次性全面调查, 门组织的一次性全面调查,主要用来调查属于一定时点上 现象的总体特征,如全国人口普查、国有资产普查、 现象的总体特征,如全国人口普查、国有资产普查、全国 工业普查、全国第三产业普查等。 工业普查、全国第三产业普查等。 相对于全面统计报表,普查能取得内容更详尽、 相对于全面统计报表,普查能取得内容更详尽、分类 更细致的统计资料,但普查耗费的人力、物力、财力较多, 更细致的统计资料,但普查耗费的人力、物力、财力较多, 不宜经常进行,而应根据实际需要间隔一定的时间进行, 不宜经常进行,而应根据实际需要间隔一定的时间进行, 比如我国从1990年起每隔 年进行一次全国人口普查。 年起每隔10年进行一次全国人口普查 比如我国从 年起每隔 年进行一次全国人口普查。 12 普查具有一下特点: 普查具有一下特点: (1) 一般规定统一的标准时点; ) 一般规定统一的标准时点; (2) 严格设定必需的调查项目; ) 严格设定必需的调查项目; (3) 按一定的周期进行同类普查; ) 按一定的周期进行同类普查; (4) 普查取得的资料更全面、更系统 普查取得的资料更全面、13 2.统计报表调查(statistical report forms) . 统计报表调查是指按照国家统一规定 的表格形式、统一的指标、 的表格形式、统一的指标、统一的报送 程序和报送时间, 程序和报送时间,自下而上逐级提供基 本统计资料的一种调查组织形式。 本统计资料的一种调查组织形式。我国 现行的统计报表, 现行的统计报表,包括国民经济基本统 计报表和专业统计报表。 计报表和专业统计报表。14 统计报表调查的优点: 统计报表调查的优点:(1) 在报表实施范围内,各报告单位按期报送,可 ) 在报表实施范围内,各报告单位按期报送, 保证调查资料的全面性、连续性和及时性; 保证调查资料的全面性、连续性和及时性; (2) 统计报表调查事先已作为一种制度布置到基层 ) 报告单位, 报告单位,要求各单位根据原始记录和统计台账提 供报表所需的资料, 供报表所需的资料,从而保证了资料来源的可靠性 和准确性; 和准确性; (3) 由于统计报表调查是逐级整理上报,统计资料 ) 由于统计报表调查是逐级整理上报, 可以使各级地方政府和部门及时了解和掌握本地区、 可以使各级地方政府和部门及时了解和掌握本地区、 本部门的基本情况。 本部门的基本情况。15 统计报表调查的局限性: 统计报表调查的局限性 1、涉及的范围广、内容多,花费的人力、物 、涉及的范围广、内容多,花费的人力、 力较多; 力较多; 2、在统计法制不健全、执行不严的情况下, 2、在统计法制不健全、执行不严的情况下, 统计报表调查在逐级上报过程中容易受到 有关人员主观因素的干扰, 有关人员主观因素的干扰,从而影响资料 的准确性; 的准确性; 3、统计报表中的指标项目相对固定,当被研 、统计报表中的指标项目相对固定, 究现象变化较快时, 究现象变化较快时,统计报表缺乏应有的 灵活性。 灵活性。 16 3.抽样调查(sampling survey) .抽样调查抽样调查是一种非常重要的非全面调查组织形式。 抽样调查是一种非常重要的非全面调查组织形式。 非全面调查组织形式 它是按照随机原则从被研究的总体中抽取一部分单位 组成样本, 组成样本,根据样本的调查结果对总体的数量特征作 出具有一定可靠程度的推断的一种统计调查方式。 出具有一定可靠程度的推断的一种统计调查方式。 随机原则是抽样调查所必须遵循的基本原则, 随机原则是抽样调查所必须遵循的基本原则,它 是抽样调查所必须遵循的基本原则 是指在抽样过程中, 是指在抽样过程中,样本单位的抽取不能受任何主观 因素及其他系统因素的影响, 因素及其他系统因素的影响,保证总体中各个单位都 有同等的机会被抽选出来的原则。只有遵循随机原则, 有同等的机会被抽选出来的原则。只有遵循随机原则, 才能保证抽选出来的样本单位的分布近似于总体的分 从而确保样本对总体的代表性。 布,从而确保样本对总体的代表性。 17 抽样调查的特点及应用方面: 抽样调查的特点及应用方面:第一,从总体中随机抽取样本单位。 第一,从总体中随机抽取样本单位。 第二, 第二,抽样调查的目的是根据样本的 数量特征推断总体的数量特征。 数量特征推断总体的数量特征。 第三, 第三,抽样误差可以事先计算并且加 以控制。 以控制。 抽样调查的应用 p31-32 18 4. 重点调查在调查对象中选择一部分重点单位进行调查, 在调查对象中选择一部分重点单位进行调查,用以 反映总体基本情况的一种非全面调查方法, 反映总体基本情况的一种非全面调查方法,称为重 点调查。 点调查。 重点单位,是指所要调查的标志而言,标志值 重点单位,是指所要调查的标志而言, 所占比重较大的总体单位。 所占比重较大的总体单位。 这些单位虽然只是总体 中的一部分, 中的一部分,但其调查的标志值之和却在总体标志 总量中占有很大比重, 总量中占有很大比重,在总体中具有举足轻重的作 用。通过对这部分重点单位的调查,可以从数量上 通过对这部分重点单位的调查, 说明总体在该标志总量方面的基本情况。 说明总体在该标志总量方面的基本情况。 19 5.典型调查 p33 .根据调查目的与要求, 根据调查目的与要求,在对所研究现象全面分析 的基础上,有意识地选择有代表性的典型单位 典型单位进行 的基础上,有意识地选择有代表性的典型单位进行 深入细致地调查, 深入细致地调查,以便认识事物的本质与发展规律 的一种非全面调查方法。 的一种非全面调查方法。 典型单位,是指那些能充分、 典型单位,是指那些能充分、集中地体现调查对 象总体某些方面共性特征的最有代表性的单位。 象总体某些方面共性特征的最有代表性的单位。 典型调查方式有两种:一是“解剖麻雀” 典型调查方式有两种:一是“解剖麻雀”式调查 ; 二是“划类选典”式的调查, 二是“划类选典”式的调查,它在调查对象总体各 单位之间的差异较大时适用。 单位之间的差异较大时适用。 20 (二)数据的搜集方法1.访问调查法 .访问调查法是调查者通过与被调查者的当面交谈而 得到所需资料的调查方法。在访问调查中, 得到所需资料的调查方法。在访问调查中,调查人员可以 直接了解被调查者对调查问题的态度、观点、举止和调查 直接了解被调查者对调查问题的态度、观点、 现场的环境等, 现场的环境等,为判断调查资料的准确程度提供一定的依 与其他调查法相比,访问调查法的特点有: 据。与其他调查法相比,访问调查法的特点有:回答率较 数据比较准确、可使用较复杂的问卷等, 高、数据比较准确、可使用较复杂的问卷等,但调查成本 一般比较高。 一般比较高。 按照调查对象的不同,访问调查法可分为居民入户调 调查对象的不同 按照调查对象的不同,访问调查法可分为居民入户调 查和个别采访两种。按照对调查过程控制程度的不同, 过程控制程度的不同 查和个别采访两种。按照对调查过程控制程度的不同,访 非标准式访问和标准式访问两种 问调查法又可分为非标准式访问和标准式访问两种。 问调查法又可分为非标准式访问和标准式访问两种。 21 非标准式访问是调查人员根据某 个主题, 个主题,由调查人员与被调查者自由 交谈而获得资料的方法。非标准式访 交谈而获得资料的方法。 问的优点是访问具有较大的弹性, 问的优点是访问具有较大的弹性,有 利于发挥访问者和被访问者的主动性、 利于发挥访问者和被访问者的主动性、 创造性,从而获得准确的资料。 创造性,从而获得准确的资料。 22 2.问卷调查法 .问卷的形式是一份预先精心设计好的问题表格, 问卷的形式是一份预先精心设计好的问题表格, 主要用来测定人们的行为、态度和特征。 主要用来测定人们的行为、态度和特征。 问卷调查就是将事先设计好的问卷,通过邮局、 问卷调查就是将事先设计好的问卷,通过邮局、 网络或调查员送到每一个被调查者的手中, 网络或调查员送到每一个被调查者的手中,由被调 查者自己填答问题,然后仍通过邮局、 查者自己填答问题,然后仍通过邮局、网络寄回或 由调查员收回的一种调查方法。 由调查员收回的一种调查方法。 进行问卷调查要求被调查者有一定的文化水平 及责任心和合作精神,否则难以保证问卷的回收率, 及责任心和合作精神,否则难以保证问卷的回收率, 从而影响调查资料的质量。 从而影响调查资料的质量。由于问卷调查的应用非 常广泛,后面将会详细介绍其内容。 常广泛,后面将会详细介绍其内容。 23 3.德尔菲法 .德尔菲法是指按照规定的程序,采用邮寄或电 德尔菲法是指按照规定的程序, 是指按照规定的程序 子邮件的方式,反复多次地收集各地专家的看法, 子邮件的方式,反复多次地收集各地专家的看法, 使不同意见趋于一致的调查方法。 使不同意见趋于一致的调查方法。德尔菲法有匿名 定量化和轮回反馈式等特点。专家们互不通气, 性、定量化和轮回反馈式等特点。专家们互不通气, 匿名发表意见,便于获得真实有效的资料。 匿名发表意见,便于获得真实有效的资料。反复地 询问也能使调查结果更加准确可靠。 询问也能使调查结果更加准确可靠。实施这种方法 的一般步骤为:拟定意见征询表、 的一般步骤为:拟定意见征询表、选定适量的征询 专家、分几轮征询专家的意见、进行资料的处理等, 专家、分几轮征询专家的意见、进行资料的处理等, 最后作出调查结论。 最后作出调查结论。24 4.电脑辅助调查法 .调查者将设计好的抽样方案、 调查者将设计好的抽样方案、问题和答案输入电 整个调查过程,包括电话拨号、结果记录、 脑,整个调查过程,包括电话拨号、结果记录、数 据处理和展示,都由计算机完成的数据搜集方法。 据处理和展示,都由计算机完成的数据搜集方法。 在进行电脑辅助调查时, 在进行电脑辅助调查时,需要依靠电脑辅助调查系 统(Computer―Assisted Telephone Interviewing System,CATIS)进行,调查员坐在计算机显示器 , )进行, 依据荧屏上显示的问题逐一向被调查者提问, 前,依据荧屏上显示的问题逐一向被调查者提问, 并将答案输入电脑, 并将答案输入电脑,也可完全由计算机完成提问和 记录的过程。这种方法的优点是时效性强、费用低, 记录的过程。这种方法的优点是时效性强、费用低, 能较快地搜集有关数据。 能较快地搜集有关数据。 25 5.实验法 .实验法是在某个特殊的实验环境下, 实验法是在某个特殊的实验环境下,对被调查 者进行实验以取得资料的调查方法。例如, 者进行实验以取得资料的调查方法。例如,企业要 比较两种新产品的优劣,可通过试销实验, 比较两种新产品的优劣,可通过试销实验,来决定 发展的重点。实验法一般包括提出研究假设、进行 发展的重点。实验法一般包括提出研究假设、 实验设计、选择实验对象、 实验设计、选择实验对象、控制实验环境和收集实 验数据等步骤。实验法具有方法科学、反映客观、 验数据等步骤。实验法具有方法科学、反映客观、 过程容易控制等优点,但也有时间长、费用高、 过程容易控制等优点,但也有时间长、费用高、实 验对象选择的难度大等不足。 验对象选择的难度大等不足。 26 6.网络调查 .网络调查(又称网上调查) 网络调查(又称网上调查)是指利用国际互联 网作为技术载体和信息交换平台进行调查的数据搜 集方法。其业务流程大体包括方案设计、问卷上网、 流程大体包括方案设计 集方法。其业务流程大体包括方案设计、问卷上网、 问卷检查、数据处理与分析、调查报告等。 问卷检查、数据处理与分析、调查报告等。网络调 查具有匿名性 成本低、速度快、调查对象广泛等 匿名性、 查具有匿名性、成本低、速度快、调查对象广泛等 特点,调查结果相对可靠。现在电子邮件调查、 特点,调查结果相对可靠。现在电子邮件调查、网 页调查、免费下载工具调查、民意调查、 页调查、免费下载工具调查、民意调查、超前性问 题调查等已被广泛使用。当然, 题调查等已被广泛使用。当然,网上调查也存在结 果的可信度不高、代表性差、 果的可信度不高、代表性差、难以消除重复填报等 问题。 问题。 27 第二节 调查设计 P35一、调查方案的结构 (p35-37)一份完整的调查方案,应该包括以下基本内容: 一份完整的调查方案,应该包括以下基本内容: 1.确定调查目的; .确定调查目的; 2.明确调查对象、调查单位和报告单位; .明确调查对象、调查单位和报告单位; 3.拟定调查项目与调查表; .拟定调查项目与调查表; 4.确定调查时间、调查方式与方法; .确定调查时间、调查方式与方法; 5.制定调查的组织工作实施计划。 .制定调查的组织工作实施计划。 28 调查方案的结构调查方案中一些重要概念: 调查方案中一些重要概念: 1.调查对象就是根据调查目的确定的、在某种性质 调查对象就是根据调查目的确定的、 调查对象就是根据调查目的确定的 上相同的许多个体单位所组成的集合。 上相同的许多个体单位所组成的集合。 2.调查单位就是调查对象范围内的各个个体单位。 调查单位就是调查对象范围内的各个个体单位。 调查单位就是调查对象范围内的各个个体单位 调查单位与报告单位是两个不同的概念。 调查单位与报告单位是两个不同的概念。调查单 是两个不同的概念 位是调查项目的承担者, 位是调查项目的承担者,而报告单位则是负责向调 查研究机构提供所需统计资料的基层单位。 查研究机构提供所需统计资料的基层单位。调查单 位与报告单位有时是同一个单位, 位与报告单位有时是同一个单位,有时则是不同的 单位。 单位。 29 3. 调查项目就是反映调查单位特征的名称。 调查项目就是反映调查单位特征的名称 就是反映调查单位特征的名称。 在确定调查项目时必须注意如下几个问题: 在确定调查项目时必须注意如下几个问题: (1) 调查项目的含义必须明确,不能模棱两可; ) 调查项目的含义必须明确,不能模棱两可; (2) 考虑取得资料的可行性,有些调查项目虽然需 ) 考虑取得资料的可行性, 但在现有条件下难以取得资料的则不应列入; 要,但在现有条件下难以取得资料的则不应列入; (3) 调查项目的答案应满足完备性和互斥性。如果 ) 调查项目的答案应满足完备性和互斥性。 要求选择回答,则必须列出所有可能的答案, 要求选择回答,则必须列出所有可能的答案,以免 出现重复或遗漏; 出现重复或遗漏; (4) 确定不同时期同类调查的调查项目时,前后时 ) 确定不同时期同类调查的调查项目时, 期的调查项目应互相衔接,以便进行动态比较分析。 期的调查项目应互相衔接,以便进行动态比较分析。 30 4. 调查表是指把所要调查的项目按照一定的结 调查表是指把所要调查的项目按照一定的结 构和顺序排列后形成的表格。 构和顺序排列后形成的表格。它是调查项目的表现 形式, 形式,也是向调查单位取得原始统计资料的重要工 利用调查表进行调查, 具。利用调查表进行调查,能够条理清晰地填写需 要搜集的资料,也便于调查结束后对资料进行整理。 要搜集的资料,也便于调查结束后对资料进行整理。 根据一份表格上容纳调查单位的多少,调查表 根据一份表格上容纳调查单位的多少, 可以分为一览表和单一表 一览表和单一表。 可以分为一览表和单一表。一览表是指一份表格上 可以登记两个及两个以上调查单位有关调查项目的 调查表; 调查表;单一表是指一份表格上只登记一个调查单 位有关调查项目的调查表。 位有关调查项目的调查表。 5. 调查时间是指调查资料所属的时间。 调查时间是指调查资料所属的时间。 是指调查资料所属的时间 二、问卷设计(一) 问卷的结构 问卷(Questionnaires)又称问卷表,是以书面 问卷( )又称问卷表, 的形式,按照设计好的顺序, 的形式,按照设计好的顺序,由一系列问题和相应 的备选答案组成的表格。 的备选答案组成的表格。 其结构主要包括: 其结构主要包括: (1)问卷标题; )问卷标题; (2)问卷说明; )问卷说明; (3)填写要求; )填写要求; (4)甄别部分; )甄别部分; (5)主体内容; )主体内容; (6)编码; )编码; (7)背景。 )
背景。 32 (二)提问项目的设计 (p38-41)问卷的主体内容是由根据调查目的和要求而 设计的问题和备选答案构成的, 设计的问题和备选答案构成的,问题设计的质量将 直接影响到调查目的能否达到。 直接影响到调查目的能否达到。 在设计问题时要注意: 在设计问题时要注意:提问的内容应该尽可能 地短;用词要通俗、准确;避免诱导性提问、 地短;用词要通俗、准确;避免诱导性提问、否定 式提问、对敏感性问题的直接提问; 式提问、对敏感性问题的直接提问;一项提问一般 只能围绕一个问题进行,不能涉及多个问题等。 只能围绕一个问题进行,不能涉及多个问题等。 33 问题顺序安排的规则: 问题顺序安排的规则:(1)问题的顺序安排应注意逻辑性; )问题的顺序安排应注意逻辑性; (2)问题的顺序安排应注意兴趣性; )问题的顺序安排应注意兴趣性; (3)问题的顺序安排应注意先易后难; )问题的顺序安排应注意先易后难; (4)开放性问题一般放在最后。 )开放性问题一般放在最后。34 例题分析请问您认为哪个电视台办的娱乐节目最好看? 例2.1 请问您认为哪个电视台办的娱乐节目最好看? 这个问题的时间定义不明,可以改为: 这个问题的时间定义不明,可以改为: 请问您认为最近一个月哪个电视台办的娱乐节目 最好看? 最好看? 例2.2 您认为白猫牌洗衣粉的洗涤效果和漂白效果 怎么样? 怎么样? 由于它涉及多个问题,可以改为两个问题提问: 由于它涉及多个问题,可以改为两个问题提问: 您认为白猫牌洗衣粉的洗涤效果怎么样? 您认为白猫牌洗衣粉的洗涤效果怎么样? 您认为白猫牌洗衣粉的漂白效果怎么样? 您认为白猫牌洗衣粉的漂白效果怎么样? 例题分析您认为联想笔记本电脑的质量很好是吗? 例2.3 您认为联想笔记本电脑的质量很好是吗? 这个问题已经暗示了联想笔记本电脑质量很好, 这个问题已经暗示了联想笔记本电脑质量很好, 对被调查者有诱导作用。可以改为: 对被调查者有诱导作用。可以改为: 您觉得联想笔记本电脑的质量怎样? 您觉得联想笔记本电脑的质量怎样? 例2.4 您觉得我校计算机基础的课堂教学质量差 吗? 这个问题既有暗示计算机基础的课堂教学质量差 的含义,又不是人们习惯的肯定陈述的提问, 的含义,又不是人们习惯的肯定陈述的提问,可 以改为: 以改为: 您觉得我校计算机基础的课堂教学质量怎么样? 您觉得我校计算机基础的课堂教学质量怎么样? 例题分析例2.5 您觉得我国居民消费价格指 数的设计科学吗? 数的设计科学吗?由于人们对某一方面专业知识的掌握程 度有差异, 度有差异,居民消费价格指数的概念及其设 计原理并非所有人都了解, 计原理并非所有人都了解,属于比较专业的 知识。在问卷调查中的用词应该通俗化, 知识。在问卷调查中的用词应该通俗化,以 便能为调查对象中的绝大多数人所理解, 便能为调查对象中的绝大多数人所理解,避 免采用过于专业的术语。 免采用过于专业的术语。 37 例题分析您的年收入有多少? 例2.6 您的年收入有多少? 对于这类被调查者不愿意外人知道的敏感性问 一是除非非常有必要,否则应避免提问。 题,一是除非非常有必要,否则应避免提问。因为 人们可能采用虚报的方式应付回答,以至于调查数 人们可能采用虚报的方式应付回答, 据失真。二是在研究目的要求涉及个人收入、 据失真。二是在研究目的要求涉及个人收入、私人 交往对象、家庭生活状况、 交往对象、家庭生活状况、政治观点等敏感性问题 一般要采用婉转的间接提问法, 时,一般要采用婉转的间接提问法,尽可能降低被 调查者的反感程度。 调查者的反感程度。 38 回答项目的设计(p39-41) (三) 回答项目的设计 按照答案之间的关系, 按照答案之间的关系,可把提问分 开放性问题和封闭性问题两大类 两大类。 为开放性问题和封闭性问题两大类。 开放性问题属于自由回答型; 开放性问题属于自由回答型; 自由回答型 封闭性问题属于选择回答型, 封闭性问题属于选择回答型,其回答 选择回答型 的方法又可分为两项选择法 两项选择法、 的方法又可分为两项选择法、多项选择 法、顺序选择法、评定尺度法、双向列 顺序选择法、评定尺度法、 联法等。 联法等。 回答项目的设计:回答的类型与方法回 答 的 类 型 与 方 法 开放性问题 (自由回答型) 自由回答型)两项选择法 多项选择法单项选择型 多项选择型 限制选择型封闭性问题 (选择回答型) 选择回答型)顺序选择法 评定尺度法 双向列联法40 1.开放性问题 .开放性问题是指问卷没有提供任何参考答案, 开放性问题是指问卷没有提供任何参考答案, 由被调查者根据题目的基本要求, 由被调查者根据题目的基本要求,按照自己的理解 自由地选择回答形式的一类问题。 自由地选择回答形式的一类问题。开放性问题可以 采用填空和自由回答两种方式。 采用填空和自由回答两种方式。填空方式的开放性 问题可举例如下: 问题可举例如下: 请问您今年平均每月的通信费用是多少? 例2.7 请问您今年平均每月的通信费用是多少? 例2.8 请问您最喜欢使用的笔记本电脑是什么品牌 的? 41 自由回答方式的开放性问题可举例如下: 自由回答方式的开放性问题可举例如下: 例2.9 请问您认为中国的高考形式应该作哪些方面的 改革? 改革? 请问您喜欢××产品的理由是什么? ××产品的理由是什么 例2.10 请问您喜欢××产品的理由是什么? 开放性问题的优点是便于被调查者详细地表达 开放性问题的优点是便于被调查者详细地表达 自己的观点,适合于潜在答案较多的问题。缺点是 自己的观点,适合于潜在答案较多的问题。缺点是 可能占用被调查者较多的时间, 可能占用被调查者较多的时间,致使部分被调查者 放弃回答;答案不统一, 放弃回答;答案不统一,给资料整理和分析带来困 难。42 2.封闭性问题 .封闭性问题是指调查者已经设计好若干个 答案, 答案,被调查者只需从中选择一个或一个以上 答案的问题。对封闭性问题的设计, 答案的问题。对封闭性问题的设计,答案要遵 循穷尽性和互斥性的原则,即既不能遗漏,又 穷尽性和互斥性的原则,即既不能遗漏, 不能有相互重叠的内容。 不能有相互重叠的内容。如果有很多可供选择 的答案,在列出主要的答案后, 的答案,在列出主要的答案后,用“其他”二 其他” 字代表未列出的答案。 字代表未列出的答案。 43 (1) 两项选择法。这是指提出的问题只有两种备选 ) 两项选择法。 答案的提问方法。 答案的提问方法。 你喜欢使用方正笔记本电脑吗?( ?(在同意的 例2.11 你喜欢使用方正笔记本电脑吗?(在同意的 方框中划“ ” 方框中划“√”。) ① 喜欢 □ ② 不喜欢 □44 (2) 多项选择法。这是指提出的问题有两种以上 ) 多项选择法。这是指提出的问题有两种以上 的备选答案, 的备选答案,被调查者可以从备选答案中选择一个 或多个回答的提问方法。 或多个回答的提问方法。 例2.12 你现在使用手机的品牌是什么?(在同意的 你现在使用手机的品牌是什么?( ?(在同意的 方框中划“ ” 方框中划“√”。) ① 诺基亚 □ ② 摩托罗拉 □ ③ 三星 □ ④ 波导 □ ⑤ LG □ ⑥ 其它 □ 对绝大多数人而言, 对绝大多数人而言,当前经常使用的手机一般只有 一个,因而是单项选择。 一个,因而是单项选择。 45 你曾经使用过的手机的品牌有哪些?( ?(在选 例2.13 你曾经使用过的手机的品牌有哪些?(在选 择的方框中划“ ” 择的方框中划“√”。) ① 诺基亚 □ ② 摩托罗拉 □ ③ 三星 □ ④ 波导 □ ⑤ LG □ ⑥ 其它 □ 对于曾经使用过的手机,答案既可以是一个, 对于曾经使用过的手机,答案既可以是一个,又可 以是多个。 以是多个。46 (3) 顺序选择法。 ) 顺序选择法。 这是在有多个答案选择时, 这是在有多个答案选择时,被调查者根据自己的 偏好程度判断各答案的重要性, 偏好程度判断各答案的重要性,并按顺序列出答案 的方法。 的方法。这类答案的设计要求设计者充分考虑被调 查者理解能力的差异, 查者理解能力的差异,让他们能够顺利地写出答案 的顺序。 的顺序。 传递内容较多、有电子文档的书面材料时, 例2.14 传递内容较多、有电子文档的书面材料时, 你所选择的传递方式的顺序是: 你所选择的传递方式的顺序是: 在您认为最有效的方式后面的方框中写“ , (在您认为最有效的方式后面的方框中写“1”,其 次写“ ,以此类推。) 次写“2”,以此类推。) ① 手机发送 □ ② 传真打印稿 □ ③ 邮寄打印稿 □ ④ 用E-mail传递 □ 传递 例2.15 请您按照喜欢的程度对以下品牌洗发水的前三个 进行编号: 进行编号: ① 飘柔 □ ② 海飞丝 □ ③ 舒蕾 □ ④ 风影 □ ⑤ 潘婷 □ ⑥ 沙宣 □ ⑦ 润持 □ ⑧ 顺爽 □ (4) 评定尺度法。运用评定尺度法时,问题的答案由表 ) 评定尺度法。运用评定尺度法时, 示不同等级的形容词按照一定的顺序排列而成。 示不同等级的形容词按照一定的顺序排列而成。 您对中国电信的服务是否满意?( ?(在选择的方框 例2.16 您对中国电信的服务是否满意?(在选择的方框 中划“ ” 中划“√”。) ① 非常不满意 □ ② 不满意 □ ③ 一般 □ ④ 满意 □ ⑤ 非常满意 □ 为了解教师的教学质量,请在你赞成项目的空格内划“ ” 例2.17 为了解教师的教学质量,请在你赞成项目的空格内划“√”。(5) 双向列联法。 ) 双向列联法。 这是运用表格的形 式,综合反映两方 面问题的方法。 面问题的方法。表 的横向和纵向分别 反映两类问题, 反映两类问题,具 有节省问卷篇幅、 有节省问卷篇幅、 便于比较和内容综 合的特点。 合的特点。项目好一 般差1.教学工作认真负责,敬业 勤勉 2.注意言传身教 3.教学内容充实,重点突出 4.表述(口头表达和板书) 清楚 5.注重对学习方法和能力的 培养 6.讲课富有启发性 7.理论联系实际 8.使用普通话 9.仪表庄重,上课精神饱满 第三节 统计数据整理 p41 一、统计数据整理的基本程序 (一)审核 (二)分类或分组 (三)编表作图50 一、统计数据的审核(一)直接数据的审核 直接数据的审核 直接数据进行审核 主要审核资料的及时性 进行审核, 及时性、 对直接数据进行审核,主要审核资料的及时性、 准确性和完整性。 准确性和完整性。 (1)及时性检查,就是检查需要的统计数据是否 )及时性检查, 在规定的时间内已经上报到调查机构,缺一、 在规定的时间内已经上报到调查机构,缺一、两 个单位的资料都会影响整个汇总工作。 个单位的资料都会影响整个汇总工作。 (2)完整性检查,一是看所有的调查表格或问卷 )完整性检查, 是否收齐, 是否收齐,二是看所有的调查项目的答案是否完 整。 (3)准确性检查,就是检查原始资料是否准确可 )准确性检查, 这是原始资料审核的中心。 靠,这是原始资料审核的中心。其审核方法有两 一是逻辑检查 二是计算检查 逻辑检查;二是计算检查。 个:一是逻辑检查 二是计算检查。 51 一、统计数据的审核(二) 间接数据的审核 对间接数据进行审核,应审核数据的适用性 适用性和 对间接数据进行审核,应审核数据的适用性和时 效性。 效性。 有些间接数据来自多种渠道, 有些间接数据来自多种渠道,是为特定目的专门 调查而取得的,或者是已经按特定目的做了加工整 调查而取得的, 对于使用者来说,应先弄清数据的来源、 理。对于使用者来说,应先弄清数据的来源、计算 口径及有关背景资料, 口径及有关背景资料,以便确定这些数据是否符合 自己研究的需要,不能盲目套用。 自己研究的需要,不能盲目套用。 审核间接数据的时效性是因为有些数据的时效性 较强,如果所取得的数据过于滞后, 较强,如果所取得的数据过于滞后,可能失去研究 的意义。 的意义。 52 二、品质数据的整理与展示(一) 分类数据的整理与展示 1.频数和频数分布 . 频数是指落在某类中的数据个数 是指落在某类中的数据个数, 频数是指落在某类中的数据个数,又称为次 数。 在分类的基础上, 在分类的基础上,将总体的所有单位按类进 行整理,形成总体单位在各组间的分布,称为频 行整理,形成总体单位在各组间的分布,称为频 数分布或次数分布。 数分布或次数分布。 或次数分布 频数分布的构成要素有两个 有两个: 频数分布的构成要素有两个:一是品质标志 的各种具体表现。 的各种具体表现。二是与各个组相对应的总体单 位数,即频数; 位数,即频数;或各组单位数占总体单位总数的 比重,即频率,它可以用百分数表示, 比重,即频率,它可以用百分数表示,也可以用 小数表示。 小数表示。 频数分布可以用表格的形式反映, 频数分布可以用表格的形式反映,也可以 用图形来表现。用表格来反映的称为频数分布 用图形来表现。用表格来反映的称为频数分布 而用图表现的称为频数分布图 频数分布图。 表,而用图表现的称为频数分布图。 例2.14 某市场调查公司为研究不同品牌洗发水 的市场占有率, 的市场占有率,对随机抽取的一家超市进行调 查。调查员某天对50名顾客购买洗发水的品牌 调查员某天对 名顾客购买洗发水的品牌 原始数据如下: 进行登记 ,原始数据如下:54 55 利用EXCEL频数分布表和柱形图的步骤如下: 频数分布表和柱形图的步骤如下: 利用 频数分布表和柱形图的步骤如下第一步: 第一步:在“工具”下拉菜单中选择“数据分析”。 工具”下拉菜单中选择“数据分析” 第二步: 第二步:在“数据分析”的选择栏中选择“直方图”,单 数据分析”的选择栏中选择“直方图” 击“确定”项。 确定” 第三步:用鼠标圈定或键盘输入对话框“输入区域” 第三步:用鼠标圈定或键盘输入对话框“输入区域”框中的数据 区域(本例为B1:B60)。 区域(本例为 : )。 用鼠标圈定或键盘输入对话框“接收区域” 用鼠标圈定或键盘输入对话框“接收区域”框中的代码区 域(本例为C2:C6); 本例为 : ); 在“输出选项”中选择“输出区域”并键入结果输出的区域(本 输出选项”中选择“输出区域”并键入结果输出的区域( 例为D2);选择“图表输出” 在这里暂不选择“ );选择 例为 );选择“图表输出”;在这里暂不选择“Pareto图”和“累积百 图 分率” 点击“确定”选项。 分率”。点击“确定”选项。 Excel输出的结果如表 所示: 输出的结果如表2-2所示: 输出的结果如表 所示 56 表2-2 Excel输出的频数结果 输出的频数结果57 2.分类数据的图示 .分类数据的图示方法主要包括条形图、 分类数据的图示方法主要包括条形图、 Pareto图、对比条形图和饼图。 图 对比条形图和饼图。 (1) 条形图 ) 若将各类别放在纵轴 用宽度相同、 纵轴, 若将各类别放在纵轴,用宽度相同、长度不 等的横条表示各类的频数多少这样形成的图形称 为条形图。有了频数分布表后可直接应用Excel 为条形图。有了频数分布表后可直接应用 中的“图表向导” 选择“条形图” 点击“ 中的“图表向导”,选择“条形图”,点击“下 一步” 数据区域” 一步”,在“数据区域”内键入数据类别和相应 的次数的位置(在例2.14为D3:E8),点击“完 ),点击 的次数的位置(在例 为 : ),点击“ 即可得到条形图( 成”,即可得到条形图(图2-3)。 )。 58 条形图59 柱形图60 (3) 对比条形图 )当分类变量在不同时间或空间上有多个值时, 当分类变量在不同时间或空间上有多个值时, 为表明它们各自在不同时间或空间上的变化情况, 为表明它们各自在不同时间或空间上的变化情况, 可绘制对比条形图。 图表向导” 条形图” 可绘制对比条形图。在Excel“图表向导”的“条形图” 图表向导 选择子图表类型的一个即可。 中,选择子图表类型的一个即可。 某批发部经营的五种饮料, 例2.15某批发部经营的五种饮料,第二、三季度销售 某批发部经营的五种饮料 第二、 情况如表2-6所示 所示: 情况如表 所示:61 62 (4) 饼图(pie chart) ) 饼图( )有了频数分布表后, 图表向导” 饼图” 有了频数分布表后,在Excel“图表向导”的“饼图” 图表向导 点击“下一步” 键入数据区域;点击“ 中,点击“下一步”,键入数据区域;点击“下一 在数据标志中选择“ 步”,在数据标志中选择“显示百分比及数据标 即可完成饼图的绘制。根据例2.14数据,制作 数据, 志”,即可完成饼图的绘制。根据例 数据 饼图如图2-6所示 所示: 饼图如图2-6所示:63 (二) 顺序数据的整理与展示 p481.累计频数和累计频率 . 累计频数是指将顺序数据中各组的次数按一定 累计频数是指将顺序数据中各组的次数按一定 的方向逐级累计所得的结果。 的方向逐级累计所得的结果。累计频率也有向上累 计和向下累计之分。 计和向下累计之分。 从顺序数据的最低一组逐级向最高一组累计频 称为向上累计 向上累计。 数,称为向上累计。 从顺序数据的最高一组逐级向最低一组累计频 称为向下累计 向下累计。 数,称为向下累计。64 例题分析【例2.20】 某县为了考查乡镇领导为老百姓排忧 . 】 解难的情况, 解难的情况,研究人员随机抽取了甲乙两个乡镇的 居民, 居民,就“您对该乡镇领导为老百姓排忧解难是否 满意”的问题,各调查了200个居民,结果如表 和 个居民, 满意”的问题,各调查了 个居民 结果如表2-7和 所示: 表2-8所示: 所示65 66 67 2.顺序数据的图示 .(1) 累计频数分布图 )68 (2) 环形图(doughnut chart) ) 环形图( )环形图的中间是一个“空洞” 环形图的中间是一个“空洞”,环上的每一段 表示顺序数据的一个类别。在表示多个总体或样本 表示顺序数据的一个类别。 数据不同类别的差异时, 数据不同类别的差异时,环形图用不同的环以示区 这是饼图不能做到的。 别,这是饼图不能做到的。69 三、数值型数据的整理p51-56 数值型数据的整理关于分类数据、 关于分类数据、顺序数据整理与展 示的所有方法都适用于数值型数据, 示的所有方法都适用于数值型数据,还 都适用于数值型数据 有一些适合于数值型数据的方法并不适 合于分类数据和顺序数据。 合于分类数据和顺序数据。70 (一) 数据分组1.数据分组的概念 . 数据分组是根据被研究现象的特征和研 数据分组是根据被研究现象的特征和研 究目的,按照一个或几个重要变量,将原始 究目的,按照一个或几个重要变量, 数据划分为性质不同的若干个组成部分的一 种统计方法。 种统计方法。 对原始数据进行分组, 对原始数据进行分组,主要是为了划分 现象的类型,研究事物内部结构的变化规律, 现象的类型,研究事物内部结构的变化规律, 以及现象之间的依存关系。 以及现象之间的依存关系。71 2.数据分组的原则(1) 科学性原则 。 保持组内总体单位的同质性和组 间总体单位的差异性。 间总体单位的差异性。 统计分组要符合穷举性原则。穷举性又称完备性, (2) 统计分组要符合穷举性原则。穷举性又称完备性, 是指总体的任一单位都有所归属, 是指总体的任一单位都有所归属,各单位都找到适合自 己的组,这样分组的结果就能包括全部单位, 己的组,这样分组的结果就能包括全部单位,不会出现 遗漏。 遗漏。 统计分组要符合互斥性原则。 (3) 统计分组要符合互斥性原则。即总体任一单位或 任一原始数据都只能归属于一个组 。72 3.数据分组的方法(1) 变量的选择及组限的划分 ) 数据分组的关键 关键是正确选择分组变量和各组界限的 数据分组的关键是正确选择分组变量和各组界限的 划分。 划分。 (2) 单变量分组与组距分组 ) 数据分组时,采用单个变量值分组, 数据分组时,采用单个变量值分组,还是采用由两 个变量值形成的区间(即组距)分组, 个变量值形成的区间(即组距)分组,这取决于变量值 的变动范围。当变量值的变动范围很小, 的变动范围。当变量值的变动范围很小,则可采用单个 如果变量值的变动范围很大, 变量值分组 ;如果变量值的变动范围很大,一般采用 组距分组。 组距分组。 注意:不同的人对同一资料分组, 注意:不同的人对同一资料分组,可能得到不同的频 率分布 。 73 4.组距及有关计算 .(1) 组距 一般情况下, 一般情况下,用两个变量值组成的一个区间作为一 个组时,该组的较小变量值叫下限 下限, 个组时,该组的较小变量值叫下限,较大变量值叫 上限,下限与上限之间的距离叫组距。如果相邻两 上限,下限与上限之间的距离叫组距。 组距 个组的组限不相等, 个组的组限不相等,则有 某组组距=本组上限 前组 某组组距 本组上限―前组上限 本组上限 前组上 如果相邻两个组的组限相等, 如果相邻两个组的组限相等,即本组下限等于 下组上限时, 下组上限时,组距为 某组组距=本组上限 本组下限 某组组距 本组上限-本组下限 本组上限 74 如果每个组的组距相等, 等距分组。 如果每个组的组距相等,叫等距分组。若各个 组的组距不完全相等, 不等距分组。 组的组距不完全相等,叫不等距分组。采用等距分 组,便于分析总体的内部结构,但也可以根据研究 便于分析总体的内部结构, 目的和资料的特殊性而采用不等距分组。 目的和资料的特殊性而采用不等距分组。 在等距分组情况下,组数确定以后, 在等距分组情况下,组数确定以后,组距也就 基本确定了。组距、 基本确定了。组距、组数与极差之间的关系用公式 表示即为: 表示即为: 组距=极差÷组数 组距 极差÷ 极差 75 (2) 确定组限组限即为相邻两组的界限,有下限和上限之分。 组限即为相邻两组的界限,有下限和上限之分。 变量的性质不同,组限的确定方法也不同。 变量的性质不同,组限的确定方法也不同。对于离 散变量,相邻组的组限相连但不重叠 不重叠, 散变量,相邻组的组限相连但不重叠,即本期上限 与后一组下限能按序连接,但不相等。比如, 与后一组下限能按序连接,但不相等。比如,高等 学校学生各个班的规模按人数分为: 学校学生各个班的规模按人数分为:15~24人、 人 25~34人、35~44人、45~54人、……对于连续变量, 对于连续变量, 人 人 人 对于连续变量 相邻组的组限必须重叠, 相邻组的组限必须重叠,即本组上限等于后一组的 下限,而本组下限又等于前一组的上限, 下限,而本组下限又等于前一组的上限,以免遗漏 数据,如考生按成绩分组为: 数据,如考生按成绩分组为:“50~60分”、 分 “60~70分”、“70~80分”、“80~90分”、 分 分 分 “90~100分”等。 分 76 “上组限不在内”原则 上组限不在内” 上组限不在内实际工作中,有时为了方便, 实际工作中,有时为了方便,确定离散变量的 组限时也按连续变量的组限确定方法处理。 组限时也按连续变量的组限确定方法处理。如果遇 到某变量值刚好等于相邻组的组限时, 到某变量值刚好等于相邻组的组限时,习惯上是将 这个变量值归入下限所在的一组,亦为“ 这个变量值归入下限所在的一组,亦为“上组限不 在内”原则,但最后一组的上限应包括在本组中。 在内”原则,但最后一组的上限应包括在本组中。 比如,甲考生的成绩为70分,那么这个70分应归入 比如,甲考生的成绩为 分 那么这个 分应归入 “70~80分”一组,而不是“60~70分”一组;若乙 分 一组,而不是“ 分 一组; 考生的成绩为100分,刚好等于最后一组的上限,则 考生的成绩为 分 刚好等于最后一组的上限, 应归入“ 应归入“90~100分”一组。 分 一组。 77 如果资料中存在极小值或极大值,通常采用开 如果资料中存在极小值或极大值,通常采用开 口组,即第一组不取下限,最后一组不取上限。 口组,即第一组不取下限,最后一组不取上限。如 某班学生考试成绩绝大多数在50~80分之间,只有某 分之间, 某班学生考试成绩绝大多数在 分之间 个学生的成绩为35分 那么第一组可设为“ 分以 个学生的成绩为 分,那么第一组可设为“60分以 若有另一个学生的成绩为95分 80~90分 下”;若有另一个学生的成绩为95分,而“80~90分” 一组中没有数据,则取最后一组为“ 分以上 分以上” 一组中没有数据,则取最后一组为“80分以上”。 当然,第一组和最后一组可以单独设为开口组, 当然,第一组和最后一组可以单独设为开口组,也 可以同时设为开口组,视数据的具体情况而定。 可以同时设为开口组,视数据的具体情况而定。 另外,确定组限时, 另外,确定组限时,要求第一组的下限略小于 或等于最小变量值, 或等于最小变量值,最后一组的上限略大于最大变 量值。 量值。 78 (3)组中值的计算 组中值的计算组中值是每一组的下限与上限之间的中点值 。 闭口组组中值=(上限-下限) 闭口组组中值=(上限-下限)÷2 =(上限 缺上限组组中值=该组下限+相邻组组距÷ 缺上限组组中值=该组下限+相邻组组距÷2 缺下限组组中值= 相邻组组距÷ 缺下限组组中值=该组上限 C 相邻组组距÷279 (4) 编制频数分布表 )利用Excel工作表编制数值型数据的频数分布 工作表编制数值型数据的频数分布 利用 表时,要先对原始数据进行排序, 表时,要先对原始数据进行排序,再取各组的上 限放在B列组成接收区域 限放在 列组成接收区域 运用在“工具”下拉菜单中的“数据分析” 运用在“工具”下拉菜单中的“数据分析”, 选择“直方图” 单击“确定” 选择“直方图”,单击“确定”项;将数据区域 和接收区域键入; 输出选项”中选择“ 和接收区域键入;在“输出选项”中选择“输出 区域”并键入结果输出的区域;选择“ 区域”并键入结果输出的区域;选择“图表输 点击“确定”选项。 出”;点击“确定”选项。80 81 频数分布表的编制 (例2) 例【例】某电 脑 公 司 2010 年前四个月 各天的销售 量数据(单 位:台)。 试对数据进 行分组。 行分组。原始 数据82 频数分布表的编制 举例(步骤)1. 确定组数; 确定组数; 2. 确定各组的组距: 组距=( 237 - 141)÷ 10=9.6 ? 10 141) 10= 组距=3.用Excel制作频数分布表 Excel制作频数分布表 83 等距分组表(上下组限重叠)84 直方图的绘制举例( 直方图的绘制举例 依据第82张的数据绘制)我一眼就看出 来了,销售量 在 170 ~ 180 之间的天数最 多! !频 数30 25直方图下的面 积之和等于1(天) 20 15 10 5140 150 160 170 180 190 200 210 220 230 240某电脑公司销售量分布的直方图 85 (二) 累计频数分布在频数分布的基础上,将各组频数依次累计, 在频数分布的基础上,将各组频数依次累计, 即形成累计频数分布。采用由小到大累计频数分布 即形成累计频数分布。 是将各组的频数, 是将各组的频数,由变量值小的组向变量值大的组 依次累计, 依次累计,它用于说明某一组上限以下各组的频数 之和, 之和,除以数据个数即可表明某一组上限以下各组 的单位总和占总体单位总和的比重, 的单位总和占总体单位总和的比重,反映了某一组 上限以下的总体单位分布状况。 上限以下的总体单位分布状况。86 四、数值型数据的图示用来反映分类数据和顺序数据的图表, 用来反映分类数据和顺序数据的图表,一般 分类数据和顺序数据的图表 都能够用于反映数值型数据的分布, 都能够用于反映数值型数据的分布,但有些反映 数值型数据分布的图表却不能应用于另外两个数 据类型。对于已经分组的数值型数据, 据类型。对于已经分组的数值型数据,一般采用 直方图反映其数据特征; 直方图反映其数据特征;对于未分组的数值型数 一般采用茎叶图和箱线图反映其数据特征。 据,一般采用茎叶图和箱线图反映其数据特征。 另外,对于时间序列数据, 另外,对于时间序列数据,一般采用线图反映其 发展变化的趋势和规律性;对于多变量数据, 发展变化的趋势和规律性;对于多变量数据,一 般采用二维或三维散点图、气泡图、 般采用二维或三维散点图、气泡图、雷达图等反 映其数据特征。 映其数据特征。 87 (一) 直方图对于分组数据直方图(histogram)的制作可分 的制作可分 对于分组数据直方图 以下几步完成: 以下几步完成: 第一步: 第一步:编制频数分布表 第二步:应用“图表向导” 产生柱形图; 第二步:应用“图表向导”,产生柱形图; 第三步:连击图内空白处,出现“ 第三步:连击图内空白处,出现“图表区格 对话框, 图案” 式”对话框,在“图案”的区域颜色选项上选择 无色,单击“确定” 连击的任一柱子, 无色,单击“确定”项;连击的任一柱子,出现 数据系列格式”对话框, 数据标志” “数据系列格式”对话框,在“数据标志”栏点 显示值” 选项”的间距宽度由150改 击“显示值”,将“选项”的间距宽度由 改 为0;单击“确定”项。 ;单击“确定” 88 25 21 20 15 10 5 0 80-120 120-160 160-200 200-240 240-280 280-320 320-360 17 12 7 12 7 489 (二) 茎叶图茎叶图(stem-and-leaf display)是由“茎”和 是由“ 茎叶图 是由 “叶”两部分组成,反映原始数据分布的图形。 两部分组成,反映原始数据分布的图形。 这里的“ 这里的“叶”由所有数据的最后一个或者两个数 字组成,前面的数字构成“ 字组成,前面的数字构成“茎”。当数据的位数 不大时, 不大时,“叶”由最后一个数字组成;当数据的 由最后一个数字组成; 位数较大时, 位数较大时,“叶”由最后两个数字组成。 由最后两个数字组成。90 未分组数据―茎叶图 例题分析 例题分析) 未分组数据 茎叶图(例题分析(原始数据见第82张) 原始数据见第 张91 未分组数据―茎叶图 扩展的茎叶图 扩展的茎叶图) 未分组数据 茎叶图(扩展的茎叶图92 (三) 箱线图箱线图( 箱线图(box plot)是利用几个描述性特征值来 ) 反映原始数据分布的图形。 反映原始数据分布的图形。它由一个箱子和两条线段 组成。由于所采用的特征值不同,箱线图有这样几种 组成。由于所采用的特征值不同, 类型:中位数/四分位数 极差( 四分位数/极差 类型:中位数 四分位数 极差(Median/Quart/Range) ) 箱线图、均值/标准误差 标准差( 标准误差/标准差 箱线图、均值 标准误差 标准差(Mean/SE/SD)箱线 ) 、、均值 标准差/1. 倍的标准差 均值/标准差 图、、均值 标准差 .96倍的标准差 (Mean/SD/1.96*SD)箱线图、均值/标准误差 )箱线图、均值 标准误差 /1.96倍的标准误差(Mean/SE/1.96*SE)箱线图。 倍的标准误差( . 倍的标准误差 )箱线图。 这里仅介绍最常用的中位数/四分位数 四分位数/极差箱线图的 这里仅介绍最常用的中位数 四分位数 极差箱线图的 制作方法,其它类型箱线图的制作与此类似。 制作方法,其它类型箱线图的制作与此类似。 93 未分组数据―单批数据箱线图(箱线图的构成) 单批数据箱线图QL 中位数 QUX 最小值X 最大值468箱线图1012Median/Quart./Range 95 未分组数据― 未分组数据―单批数据箱线图(例题分析)最小值 141 下四分位数 中位数 170.25 182 上四分位数 197 最大值 237140150160170180190200210220230 240某电脑公司销售量数据的箱线图 97 【例2.18】 . 】 从某中学高中二年级理科5班的学生 从某中学高中二年级理科 班的学生 中随机抽取10人 中随机抽取 人,对期中考试的成绩进行 调查, 门课程均按总分 分出题, 门课程均按总分100分出题 调查,6门课程均按总分 分出题,有关 数据如表2. 所示 所示。 数据如表 .10所示。试编制各科成绩的 批比较箱线图, 批比较箱线图,并分析各科成绩的分布特 征。98 99 先作按课程成绩编制的箱线图。 先作按课程成绩编制的箱线图。若 采用Excel,则需要先计算各科成绩的最 采用 , 大值、最小值、中位数、 大值、最小值、中位数、上四分位数和 下四分位数。 下四分位数。【解】和图2. 是由 是由SPSS绘制的 图2.15和图 .16是由 . 和图 绘制的 箱线图。 箱线图。 100 从图2-13中可以看出,第四名学生的总体成绩最 中可以看出, 从图 中可以看出 第七名学生的总体成绩最差, 好,第七名学生的总体成绩最差,第五名学生的 总体成绩最均衡,而第十名学生有偏科现象。 总体成绩最均衡,而第十名学生有偏科现象。101 从图2-14中可以看出,英语和物理的总体成绩最 中可以看出, 从图 中可以看出 中位数较高), ),数学课的全班成绩最集中 好(中位数较高),数学课的全班成绩最集中 箱子较短),语文课成绩参差不齐,比较分散。 ),语文课成绩参差不齐 (箱子较短),语文课成绩参差不齐,比较分散。 (四) 线图对于时间序列数据,可用 对于时间序列数据,可用Excel中“图表向导” 中 图表向导” 折线图”绘制。 的“折线图”绘制。只要在数据区域输入数据的位 单击“下一步” 并在数据标志中选择“ 置,单击“下一步”,并在数据标志中选择“显示 单击“完成”即完成线图的制作。 值”,单击“完成”即完成线图的制作。 【例2.23】 已知 . 】 已知年我国城镇居民家庭人 年我国城镇居民家庭人 均可支配收入和农村居民家庭人均纯收入资料( 均可支配收入和农村居民家庭人均纯收入资料(表212),试编制城乡居民收入的线图。 ),试编制城乡居民收入的线图 ),试编制城乡居民收入的线图。103 104 折线图” 解 用Excel中“图表向导”的“折线图”,在数 中 图表向导” 据区域输入数据的位置( : ),单击 据区域输入数据的位置(B2:C12),单击“完 ),单击“ 即完成线图的制作( 成”即完成线图的制作(图2-15)。 )。105 第四节 统计表的设计一、统计表的结构根据使用者的要求和数据的特点,统计表有多种具体形式, 根据使用者的要求和数据的特点,统计表有多种具体形式, 但不论哪种形式的统计表,从外形看都由表头、行标题、 但不论哪种形式的统计表,从外形看都由表头、行标题、列 标题和数字资料四个部分组成。 标题和数字资料四个部分组成。 表头部分主要说明统计表的名称,一般包括表号、总标 表头部分主要说明统计表的名称,一般包括表号、 主要说明统计表的名称 在所有数字资料的计量单位相同时, 题,在所有数字资料的计量单位相同时,其计量单位在表的 右上角注明。 右上角注明。 行标题通常用来表示横向变量的名称,一般在表的左边。 行标题通常用来表示横向变量的名称,一般在表的左边。 通常用来表示横向变量的名称 列标题通常用来表示纵向变量的名称 一般在表的上边。 通常用来表示纵向变量的名称, 列标题通常用来表示纵向变量的名称,一般在表的上边。 数字资料是说明现象特征的数据 是说明现象特征的数据, 数字资料是说明现象特征的数据,处在统计表的中间部 数字资料都要有明确的计量单位。 分,数字资料都要有明确的计量单位。 106 107 二、统计表的设计规则总的要求是统计表能够满足科学、实用、简练、美观的设计原则。 总的要求是统计表能够满足科学、实用、简练、美观的设计原则。具 体来说,编制统计表时应注意如下几点: 体来说,编制统计表时应注意如下几点:1.合理安排统计表的结构。 .合理安排统计表的结构。 2.统计表的总标题、行标题、列标题都要能简明扼要地说明 .统计表的总标题、行标题、 有关内容。 有关内容。 3.统计表的左右两端一律不封口;表的上下两端一般用粗线, .统计表的左右两端一律不封口;表的上下两端一般用粗线, 其他的中间线都用细线隔开。 其他的中间线都用细线隔开。 4.表中数据一般采用右对齐形式,有小数点时以小数点对齐, .表中数据一般采用右对齐形式,有小数点时以小数点对齐, 同栏数据要具有同一精确度; 同栏数据要具有同一精确度;不要求填写或不可能有答案的 表格单元,一般用“ 表示 在数字资料区不能出现“ 表示, 表格单元,一般用“―”表示,在数字资料区不能出现“同 上”、“同左”等文字。 同左”等文字。 5.若使用的是次级资料,应在表的下方注明资料来源。 .若使用的是次级资料,应在表的下方注明资料来源。 108 本章小结1.统计数据的来源 . 统计数据的来源包括次级统计数据和初级统计 数据。次级统计数据主要是从公开渠道获得的数据, 数据。次级统计数据主要是从公开渠道获得的数据, 初级统计数据主要来源于专门组织的调查和科学试 常用的统计调查方式主要有普查、 验。常用的统计调查方式主要有普查、统计报表调 查和抽样调查等。 查和抽样调查等。 搜集统计数据的具体方法有访问调查法、 搜集统计数据的具体方法有访问调查法、问卷 调查法、德尔菲法、电脑辅助调查法、小组座谈法、 调查法、德尔菲法、电脑辅助调查法、小组座谈法、 观察法、实验法、 它们各有不同的特点。 观察法、实验法、等,它们各有不同的特点。109 2.调查设计 .调查方案的结构包括调查目的、调查对象、 调查方案的结构包括调查目的、调查对象、调查单 包括调查目的 位和报告单位、调查项目与调查表、调查时间、调查组 位和报告单位、调查项目与调查表、调查时间、 织形式与方法、调查的组织工作。 织形式与方法、调查的组织工作。 问卷在结构上由问卷标题 问卷说明、填写要求、 上由问卷标题、 问卷在结构上由问卷标题、问卷说明、填写要求、 甄别部分、主体内容、编码、背景等部分组成。主体内 甄别部分、主体内容、编码、背景等部分组成。 容包括问题和答案。问题包括封闭性问题和开放性问题。 容包括问题和答案。问题包括封闭性问题和开放性问题。 提问的内容应该尽可能地短,用词要通俗、准确, 提问的内容应该尽可能地短,用词要通俗、准确, 避免诱导性提问,一项提问一般只能围绕一个问题进行。 避免诱导性提问,一项提问一般只能围绕一个问题进行。 在安排问题的顺序时应注意逻辑性、兴趣性、先易后难, 在安排问题的顺序时应注意逻辑性、兴趣性、先易后难, 开放性问题在最后。 开放性问题在最后。 在设计封闭性问题的答案时可选择两项选择法、 在设计封闭性问题的答案时可选择两项选择法、多 项选择法、顺序选择法、评定尺度法、 项选择法、顺序选择法、评定尺度法、双向列联法等方 法。 110 3.统计数据的整理 .统计数据整理的基本程序:第一步审核, 统计数据整理的基本程序:第一步审核,审核资料的及 时性、准确性和完整性;第二步分类或分组; 时性、准确性和完整性;第二步分类或分组;第三步编表作 图。 分类数据的整理与展示方法包括频数分布表 条形图、 与展示方法包括频数分布表、 分类数据的整理与展示方法包括频数分布表、条形图、 Parto图、对比条形图和饼图。 图 对比条形图和饼图。 顺序数据的整理与展示方法还包括累计频数分布表 与展示方法还包括累计频数分布表、 顺序数据的整理与展示方法还包括累计频数分布表、累 计频数分布图、环形图等。 计频数分布图、环形图等。 数值型数据在分组时 在分组时, 数值型数据在分组时,应该保持组内总体单位的同质性 和组间总体单位的差异性; 和组间总体单位的差异性;统计分组要符合穷举性和互斥性 性原则。 性原则。 数值型数据在展示时,对于已经分组的采用直方图, 数值型数据在展示时,对于已经分组的采用直方图,对于未 分组的可采用茎叶图和箱线图。 分组的可采用茎叶图和箱线图。对于时间序列数据可采用线 对于多变量数据可采用二维或三维散点图、气泡图、 图,对于多变量数据可采用二维或三维散点图、气泡图、雷 达图等。 达图等。 111 数据类型及图示数据类型品质数据(小结 小结) 小结数值型数据 组距分组数据频数分布原始数据时序数据条形图、柱形图 条形图、茎叶图直方图线图饼图 环形图箱线图 4.统计表的设计 .统计表从外形看都由表头、行标题、 统计表从外形看都由表头、行标题、 列标题和数字资料四个部分组成。 列标题和数字资料四个部分组成。统计 表的设计应该遵循有关规则。 表的设计应该遵循有关规则。113
更多搜索:
All rights reserved Powered by
文档资料库内容来自网络,如有侵犯请联系客服。}

我要回帖

更多关于 博物馆展示方式 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信