spssspss数据分析报告告出来,显示图形的时候显示不了,显示正在处理是怎么回事?

The page is temporarily unavailable
nginx error!
The page you are looking for is temporarily unavailable.
Please try again later.
Website Administrator
Something has triggered an error on your
This is the default error page for
nginx that is distributed with
It is located
/usr/share/nginx/html/50x.html
You should customize this error page for your own
site or edit the error_page directive in
the nginx configuration file
/etc/nginx/nginx.conf.您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
SPSS实践报告(最终版).doc 31页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
需要金币:350 &&
你可能关注的文档:
··········
··········
指导老师:
专业班级:
Windows 使用Windows的窗口方式展示各种管理数据和分析方法的功能,使用对话框展示各种功能选择项,清晰、直观、易学易用,涵盖面积广。由于它具有强大的图形功能,使用它不但可以得到分析后的数字结果,还可以得到直观、清晰、漂亮的统计图,形象地显示对原始数据和分析结果的各种描述。所以,作为统计专业的学生有必要掌握这门软件的使用。这次课程实践的目的主要有以下三个方面:
1.掌握SPSS的基本操作,能够熟练应用SPSS进行基本的统计分析。
2.在用SPSS对具体实例进行分析的基础上能对结果进行正确的解释。
3.在对SPSS基本操作熟练的情况下,进一步自学SPSS更强大的分析能力。
二 内容要求
1. 掌握如何通过SPSS进行数据的获取和管理,包括数据的录入,保存,读
取,转化,增加,删除;数据集的合并,拆分,排序。
2. 了解描述性统计的作用,并掌握其 SPSS 的实现(频数,均值,标准差,
中位数,众数,极差)。
3. 应用SPSS生成表格和图形,并对表格和图形进行简单的编辑和分析。
4. 应用SPSS做一些探索性分析(如方差分析,相关分析、回归分析)
5. 应用SPSS做一个案例分析(某医院护士长对床旁凝血测定仪的应用研究)
三 实验内容
1.江西省的投资收益表(单位:亿元)
年份 GDP 最终消费 居民消费 工资总额 投资总额
769.98 629.78 162.16 284.18
919.59 758.36 185.83 355.85
989.6 796.77 194.4 384.3
.03 173.93 454.77
.87 205.78 491.48
.2 204.74 548.2
1.96 225.43 660.49
4.58 243.75 924.6
1.01 271.09 04 2.14 .45 05 7.3 .31 06 2.91 .07 07 3.45 .42 08 9.89 .25 09 5.84 .39 10 9.22 .14 8775
数据的录入过程:
打开SPSS13.0软件,在SPSS的variable view里面的名称改成如下的格式:
然后再回到data view输入数据可以得到:
(2)数据的保存过程
点击SPSS的文件-保存有如下的界面:
(3)数据的读取
点击文件-打开-数据文件,然后会出现下面的窗口,只要点击你要打开的sav后缀文件:
(4)数据的转化过程:
点击数据-行列转换,将所有的拖到变量中有:
点击确定之后,data view里就会出现:
(5)数据的增加过程:
在var上右键点击就会出现插入变量,然后在variable view修改名称,
在data view里输入相应变量的数据这样就增加了一列数据有:
(6)数据的删除过程:
选取某一行,或某一列的数据,右键-清除,例如,清除投资总额的数据,在投资总额上右键,然后点击清除有:
(7)数据集的合并:
观测值合并:
先将需要合并的文件保存
年份 GDP 居民消费 工资总额
250.02 65.7
270.89 71.93
299.37 86.03
349.29 104.2
471.91 140.7
点击数据-合并-合并观测值,然后点击你要合并的文件有:
点击打开之后将不配对变量全部拖入新工作数据文件中的变量有:
正在加载中,请稍后...
27页40页24页24页74页19页140页21页21页67页spss操作讲义-海文库
全站搜索:
您现在的位置:&>&&>&司法考试
spss操作讲义
SPSS统计软件应用第一章
概述 ................................................................................................................................... 1第二章
数据文件的建立及整理 ................................................................................................. 18第三章
数据输入和输出 ............................................................................................................. 31第四章
利用SPSS进行统计描述 .............................................................................................. 37第五章
利用SPSS进行T统计检验 ......................................................................................... 60第六章
利用SPSS进行Χ2统计检验 ........................................................................................ 76第七章
均数间的比较 ................................................................................................................. 89第八章
征服一般线性模型 ....................................................................................................... 101第九章
因子分析 ....................................................................................................................... 139第十章
相关分析 ....................................................................................................................... 151 第十一章
多元线性回归与曲线拟合 ....................................................................................... 163 第十二章
分类资料的回归分析 ............................................................................................... 181 第十三章
分类分析 ................................................................................................................... 195 第十四章
非参数检验 ............................................................................................................... 212 第十五章
Survival菜单详解(1) .......................................................................................... 216 第十六章
Survival菜单详解(2) .......................................................................................... 231 第十七章
利用SPSS进行量表分析 ........................................................................................ 245 第十八章
统计绘图功能详解 ................................................................................................... 262 第十九章
描述性统计分析详 ................................................................................................... 274
(一)SPSS软件SPSS是“社会科学统计软件包”(Statistical Package for the Social Science)的简称,是一种集成化的计算机数据处理应用软件。1968年,美国斯坦福大学H.Nie等三位大学生开发了最早的SPSS统计软件,并于1975年在芝加哥成立了SPSS公司,已有30余年的成长历史,全球约有25万家产品用户,广泛分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研、教育等多个领域和行业。80年代末,Microsoft发表Windows后,SPSS迅速
向Windows移植,使软件更加直观易用。SPSS是世界上公认的三大数据分析软件之一(SAS、SPSS和SYSTAT)。年间,SPSS公司陆续购并了SYSTAT公司、BMDP公司等,由原来单一统计产品开发转向企业、教育科研及政府机构提供全面信息统计决策支持服务。伴随SPSS服务领域的扩大和深度的增加,SPSS公司已决定将其全称更改为Statistical Product and Service solutions(统计产品与服务解决方案)。目前,世界上最著名的数据分析软件是SAS和SPSS。SAS由于是为专业统计分析人员设计的,具有功能强大,灵活多样的特点,为专业人士所喜爱。而SPSS是为广大的非专业人士设计,它操作简便,好学易懂,简单实用,因而很受非专业人士的青睐。此外,比起SAS软件来,SPSS主要针对着社会科学研究领域开发,因而更适合应用于教育科学研究,是国外教育科研人员必备的科研工具。1988年,中国高教学会首次推广了这种软件,从此成为国内教育科研人员最常用的工具。(二)SPSS软件的特点①集数据录入、资料编辑、数据管理、统计分析、报表制作、图形绘制为一体。从理论上说,只要计算机硬盘和内存足够大,SPSS可以处理任意大小的数据文件,无论文件中包含多少个变量,也不论数据中包含多少个案例。②统计功能强大,包括常规的集中量数和差异量数、 相关分析、回归分析、方差分析、卡方检验、t检验和非参数检验;也包括近期发展的多元统计技术,如多元回归分析、聚类分析、判别分析、主成分分析和因子分析等方法,并能在屏幕(或打印机)上显示(打印)如正态分布图、直方图、散点图等各种统计图表。从某种意义上讲,SPSS软件还可以帮助数学功底不够的使用者学习运用现代统计技术。使用者仅需要关心某个问题应该采用何种统计方法,并初步掌握对计算结果的解释,而不需要了解其具体运算过程,能在使用手册的帮助下定量分析数据。③自从1995年SPSS公司与微软公司合作开发SPSS界面后,SPSS界面变得越来越友好,操作也越来越简单。熟悉微软公司产品的用户学起SPSS操作很容易上手。SPSS for Windows界面完全是菜单式,一般稍有统计基础的人经过三天培训即可用SPSS做简单的数据分析,包括绘制图表、简单回归、相关分析等等,关键在于如何进行结果分析及解释,这一方面需要学习一些数理统计的基本知识,另一方面也要多进行实践,在实践中了解各种统计结果的实际意义。
(三)SPSS的版本与应用环境从SPSS/PC+ V2.0~V4.0为DOS版;从SPSS/PC V6.0~V15.0为Windows版。运行SPSS的Windows10.0版(单机版),要求P2以上的PC机和1G以上硬盘(32M内存、68M硬盘储存空间和32M以上预留空间);中文Win95/98/2000平台。国内SPSS正版(WINDOWS英文单机版)价格约12000元(RMB/2001年);网络版约为单机版的10倍以上。台湾有SPSS的中文版,中国大陆尚无。(四)SPSS软件的安装与汉化SPSS安装与其他WIN软件类似,在“安装向导”提示下完成。目前尚无汉化版。一些汉化版只能汉化菜单,尚不能汉化输出结果。(五)SPSS软件的启动双击SPSS图标,进入SPSS数据编辑器(SPSS Data Editor)窗口。
(六)数据编辑器SPSS软件的主窗口,从上到下为:(1)10个主要的下拉菜单:①文件(File);②编辑(Edit);③视图(View);④数据(Data);⑤转换(Transform);⑥统计分析(Statistics)或(Analyse);⑦作图(Graphs);⑧工具(Utilities); ⑨ 窗口(Windows);⑩ 帮助(Help)
菜单栏共有9个选项:1、File:文件管理菜单,有关文件的调入、存储、显示和打印等;2、Edit:编辑菜单,有关文本内容的选择、拷贝、剪贴、寻找和替换等;3、Data:数据管理菜单,有关数据变量定义、数据格式选定、观察对象的选择、排序、加权、数据文件的转换、连接、汇总等;4、Transform:数据转换处理菜单,有关数值的计算、重新赋值、缺失值替代等;5、Statistics(Analyze):统计菜单,有关一系列统计方法的应用;6、Graphs:作图菜单,有关统计图的制作;7、Utilities:用户选项菜单,有关命令解释、字体选择、文件信息、定义输出标题、窗口设计等;8、Windows:窗口管理菜单,有关窗口的排列、选择、显示等;9、Help:求助菜单,有关帮助文件的调用、查寻、显示等。点击菜单选项即可激活菜单,这时弹出下拉式子菜单,用户可根据自己的需求再点击子菜单的选项,完成特定的功能。1.Fi1e(文件)菜单包含的具体菜单项如表1.1所示。表1.1 File菜单
2.Edit (编辑)菜单编辑菜单包括的具体菜单项如表1.2所示。3.View (视图外观)菜单
视图菜单提供了Status Bar (状态条开关)、Too1 bars (工具栏开关)等6条命令,如表1.3所示。
4.Data (数据)菜单数据菜单中包括的菜单命令类似于数据库的编辑与管理,如表1.4所示。表1.4 Data菜单
5.Transform (数据转换)菜单数据转换菜单主要用于变量转换,如表1.5所示。表1.5 Transform菜单
6.Analyze (统计分析)菜单SPSS的所有统计分析功能都集中在这个菜单下,如表1.6所示。
SPSS提供了强大、完备的统计分析方法。
7.Graphs (图形)菜单SPSS图形功能可以生成几十种不同类型的表现统计资料的图形格式的图形,SPSS图形功能还提供生成交互式统计图形的功能,可生成动态的三维统计图形。具体内容见表1.7。
8.Utilities (实用程序)菜单实用程序菜单包括数据文件中的变量信息、文件信息等命令项。具体内容如表1.8所示。表1.8
Utilities菜单
9.Windows (窗口控制)菜单窗口控制菜单提供了数据窗口最小化、数据编辑窗口和SPSS输出窗口等的切换功能。10.Help (帮助)菜单帮助菜单提供了SPSS帮助主题、SPSS教程等5项功能,如表1.9所示。
Help (帮助)菜单
SPSS不仅为我们提供了良好的数据编辑环境和完备的统计分析功能,还提供了Syntax (语法)编辑窗口,如图1―3所示。
一般,可以在SPSS的各种窗口中执行File→New →Syntax命令新建一个语法窗口,或者执行File→Open→Syntax命令打开一个事先保存的语法程序文件。窗口的绝大多数菜单命令与数据编辑窗口相同,用户可以在此窗口自行编写SPSS语法程序,通过Run菜单的菜单命令执行程序语句实现统计分析任务。并且可以将编写的语法文件保存起来,语法文件的扩展名为“*.sys”。SPSS的Output (输出)窗口SPSS Viewer,一般随执行统计分析命令而打开,用于显示统计分析结果、统计报告、统计图表,执行统计命令中产生新变量的信息,运行产生错误时的警告信息等也是在这个窗口里显示。可以在SPSS的各种窗口中执行File→New→Output命令新建一个输出窗口,或者执行File→Open→Output命令打开一个事先保存的输出文件。在这个窗口中,允许用户对输出结果进行常规的编辑整理,窗口内容可以直接保存,保存文件的扩展名为“*.spo”。可以在SPSS的各种窗口中执行File→New→Draft Output命令新建一个草稿输出窗口。
SPSS的草稿 (Draft) 输出窗口与标准输出窗口的不同,它仅仅能将统计分析结果显示出来,不允许对统计图表进行编辑操作,但是允许对输出图形作不等比例的放缩(标准输出窗口的图形放缩保持等比例),可以将草稿输出窗口的结果以文SPSS的脚本语言编辑窗口为高级用户提供了一个专门的编程环境,允许用户使用Sax Basic语言(一种与Visual Basic兼容的编程语言)编写脚本语言程序,来扩充SPSS的功能。可以执行File→New→Script命令新建一个SPSS的脚本语言编辑窗口,或者执行File→Open→Script命令打开一个保存的脚本语言文件,如图1-4所示。
对于初学者而言编写一个脚本语言程序并非易事,SPSS系统自带的Script文件夹中提供了许多示例性的脚本程序文件,可以打开这些文件学习编写脚本语言程序。(七)SPSS的菜单操作上节介绍了SPSS数据编辑窗口以及数据窗口的菜单,本节将简单介绍其使用方法。1.标题栏标题栏位于应用程序窗口的顶部,显示当前正在编辑的文件名。标题栏左侧的3个按钮为Windows的控制按钮,右侧为最小化、最大化、还原和关闭按钮。用户可以用鼠标拖动标题栏移动窗口的位置。2.下拉菜单SPSS向用户提供了符合Windows标准的下拉式菜单。展开下拉菜单以及选择菜单项的方法与Windows下其他应用软件的操作完全相同,此处不再重述。使用SPSS的菜单时,注意到有些菜单项后边有“?”符号,表明选中该项后会显示一个对话框,让用户做进一步的选择;有些菜单项右边出现“?”符号,表明该选项还包含下一级的子菜单;当某菜单选项灰显时,表明在特定的条件下此功能不能使用。3.快捷菜单SPSS还提供了方便的、智能化的快捷菜单,在窗口的任何位置右击后,SPSS会根据当前系统状态及光标位置显示相应的快捷菜单,菜单中所列项目是系统判断用户点击时机及光标位置后给出的用户最有可能用到的命令。4.工具条编辑在系统默认的情况下,SPSS在不同的窗口提供了不同的工具栏,但是每一组工具栏都有一些相同的基本功能项,也有该窗口的专用项,熟练使用工具栏,明确工具栏上各图标按钮和它对应的菜单命令,可以减轻编辑时的工作量。SPSS的菜单栏调整非常灵活、简便。鼠标指向菜单栏,右击,在展开的快捷菜单中选择Customize,打开Customize Toolbar (自定义工具栏)对话框。对话框左面为菜单分类 (Categories),右面为分类清单中被选中的菜单包含的菜单项(Items)。只需将所需工具图标拖拽至编辑工具栏 (Data Editor)上即可,同时也可将不需要的工具图标拖出编辑工具栏。如果需要改变工具图标图案,单击Edit Tool按钮,打开一个BMP
Editor (位图编辑器)对话框自行设计。5.菜单编辑SPSS允许用户对菜单编辑,选择Utifities菜单中的Menu Edit选项,弹出菜单编辑对话框,可以将Windows下的其他外部应用程序、SPSS的语法程序、脚本程序添加到SPSS的菜单中,便可在SPSS的菜单中启动这些应用程序了。将应用程序Microsoft PowerPoint编辑到SPSS数据窗口的Utilities菜单中,这样便可在数据窗口里打开这个程序.毫无疑问,这将大大地方便统计工作,比如在统计分析的同时,单击Utififies菜单中的PowerPoint将它打开,可以将统计输出结果复制PowerPoint界面编辑反映统计结果的幻灯片。不仅能在SPSS窗口的菜单中插入菜单项,而且可以在主菜单栏中插入新菜单,具体的编辑方法此处不再详细介绍。
(八)系统控制对话框及其设置SPSS允许用户根据工作要求来设置系统,单击数据窗口的Edit 菜单中的Options 选项。弹出包含10个选项卡的对话框,在每个选项卡里,可以根据需要进行不同的设置。以下简要介绍系统设置对话框的使用方法和内容说明。1
General选项卡General选项卡中列出了常规选项:1.Session Journal (运行日志)栏该栏中项目选择,用于设定工作日志的记录方式及存储位置,当选择了Record syntax in journal后,SPSS会以Append (添加)或Overwrite (覆盖)的形式将工作过程记录到指定位置或默认位置的C:\WINDOWS\TEMP\spss.jnl文件中去(扩展名为*jnl的文件称为日志文件,它由系统自行产生,记载使用SPSS的有关情况)。2.Display of Small Numbers (很小数值的显示方式)栏No scientific notation for small numbers in tables:输出表中的很小的数值将显示为0(或.000)。3.Measurement System (系统度量参数)栏度量参数框的下拉式列表中有3种度量单位:points(像素),inches(英寸)和centimeters (厘米),用于设置输出表格中单元格的宽度和打印时表与表间空格的度量单位。? Open syntax window at start-up:选择此项,启动SPSS时自动打开语法窗口。4.Output type at Start-up (启动时输出形式)栏? Viewer:运行SPSS过程以Viewer窗口为输出窗口。此选项为系统默认选项。? Draft Viewer:运行SPSS过程以Draft窗口为输出窗口。改变选项只有在下一次启动SPSS时才有效。5.Variable Lists (变量列表)栏? Display Label:对话框的变量列表中显示变量标签,系统默认选项? Display name:对话框的变量列表中显示变量名。? Alphabetically:按变量字母顺序排列源变量清单栏中的变量。? File:按变量在文件中的顺序排列源变量清单栏中的变量,系统默认选项。
6.Recently Used Files List (最近使用过的文件列表)栏设置显示在File菜单中最近使用过的文件个数。系统默认的文件个数为9。7.Temporary Directory (临时目录)框指定存放临时文件的文件夹地址。8.Output Notification (输出通告)栏选择该栏中选项设置输出时的提示信息。Raise viewer window:当新的输出结果产生后输出窗口立即显示于屏幕上。●
Scroll to new output:当新的输出结果产生后先显示于目录上。9.Sound (声音)设置:●
None (无声音)。●
System beep (系统嗡鸣声)。●
Sound:选择此选项并单击Browse (浏览) 按钮选择声音文件,则在产生输出结果时伴随播放该文件记录的音乐.系统默认的声音文件格式为“*.wav”。2
Viewer选项卡Viewer选项卡提供了Output窗口显示时的信息、图标、字体等选项。1.Initial Output State (输出窗口初始化状态)栏该栏提供了输出窗口中输出结果大纲中的图标样例,单击Item框边的箭头按钮,选择窗口的输出项,其中有log (记入日志)、warnings (警告)、notes (注释记录)、titles (标题)、Page Title (页标题)、pivot tables (枢轴表)、charts (图表)、text output (文本形式输出)、Gragh (图形)、Map (地图)。对Ihem框里选定的选项,可以选择Show (显示)或Hidden (隐藏)决定显示还是隐藏它们,以及显示时的对齐方式 (Justification):Align left (左对齐)、Center (居中对齐)或Align right (右对齐)。选择Display of commands in the log on or off选项,则在每次进入系统或者输出结果时首先显示所使用的语法命令。2.Title Font (标题字体) 栏单击栏边箭头选择输出窗口中标题和页面标题的字体、大小、显示方式及颜色。3.Text Output Page Size
(丈本输出页面设置)
栏Width列选项设置页宽,即一行可容纳的最多字符数,Length列选项设置页面长度,页中最多容纳的行数。4.Text Output Font (文本输出字体) 栏该选项设置输出窗口的文本输出字体、大小、显示方式及颜色。? Monospaced fonts:等宽字体,选择它输出结果中的字体以等宽字体输出,如不选择此项,输出结果中的表格将不能准确地对齐。3
Draft Viewer选项卡Draft Viewer选项卡提供了草稿输出窗口的各种初始设置及功能选项。1. Display Output ltems (显示输出项目) 栏该栏的内容提供了草稿输出窗口初始状态时的显示内容,其中选择Log和Display of commands in the log on将在进入系统时显示所使用的命令,其余的选项Warnings (警告)、Notes (注释记录)等与Viewer选项卡所述相同。
2.Page Break Between (分页页码插入) 栏该选项用于确定打印输出或分页显示时的分页页码插入方式。其中有:? Procedure:按程序过程分页,例如按Frequencies (频数分析)、Crosstabs (交叉表过程)等分页。? Item:按项目分页,例如按表格、图形等分页。3.Font (字体) 栏设置草稿输出窗口中的字体、字体大小。? Scale font so wide tables fit printed page:打印页面结果时减小字号以便适应表格的宽度。选择此项,在被激活的MinimumSize框中选择最小字号。4.Tabular Output (输出表样式) 栏提供Separate columns (分隔列方式) 选项。(1)Spaces (用空格)。? Repeat column header:对占据多页的表格,在每个连续页项端重复显示标题。? Display Box Character:在单元格周围显示实格线。不选此项,则Row和 Columns 小框被激活,输出表的单元格周围格线将以框中的线形显示。? Autofit:自适应列宽。? Maximum:列宽最大值,选择此项后在Character框里输入限制的最多字符个数, 显示时可以输出的列标签字符数最多可达到限定的数值。(2)Tabs (用制表符分列)。选择此项输出表无框线,如果帚用Word处理输出结果应选择此项。5.Text Output (文本输出页面设置) 栏Width列选项设置页宽,Length列选项设置页面长度。4
Output Labels选项卡Output Labels选项卡提供了输出中标签的设置选项。1.Outline Labeling (大纲标签) 栏? Variables in item labels shown as:控制输出大纲概要中的变量显示方式,包括:显示Labels(标签)、Names(变量名)和Labels and Names (标签和变量名),系统默认的显示方式为仅显示标签。? Variable value in item labels:控制输出大纲概要中变量值和值标签显示方式,包括:显示Labels(值标签)、Value(变量值)和Value and Labels (变量值和值标签),系统默认的显示方式为显示值标签。2.Pivot Table Lavels (枢轴表标签) 栏本栏的两个选项与大纲标签栏相同,只是用于控制输出的是枢轴表格中变量和变量值的显示方式 (注:枢轴表即通常由横竖交叉的直线段形成的表格)。5
Charts选项卡Charts选项卡用于设置图形输出格式。1.Chart Template (图表模板) 栏? Use curren tsettings:使用当前设置。? Use chart template:使用图表模板,若选择此项,须通过浏览按钮选择需用的图形模板
(图形模板文件必须是用户事先已经保存好的,模板文件的扩展名为*.sct)。2.Chart Aspect Ratio (图表的纵横比例) 栏用于设置输出图表的纵横比例,系统默认值为1.25,即纵:横 = 1:1.25。3.Current Settings (通用设置) 栏(1) Fond框设置图形中出现的字体。(2) Fill patterns and Line Styles(填充图案和线形)栏设置图案填充颜色及线形。? Cycle through colors,then patterns:选择此选项(系统默认)在输出的图形中用系统默认的14种颜色填充图形元素,由用户选择填充图案和线形。? Cyclethroughpatterns:选择此项时输出图形里用图案代替颜色填充。(3)Frame (边框线) 栏设置图形的边框线,可选择Outer (外边框) 或Inner (内边框) 方式。选择前者,输出的图形本体之外,另外增加一个更大的外框将图形全部框于其中。(4) Grid Lines (网格线) 栏。? Scale axis:纵轴,选择此项,输出图形中显示纵轴上的刻度及水平格线。? Category axis:分类轴,选择此项,输出图形中显示横轴上的刻度及垂直格线。 6
Interactive选项卡Interactive选项卡用于设置交互图的格式。1.ChartLook (图形外观)栏栏内有系统提供的设置图形外观的专用文件的文件名(文件扩展名为“*.clo”)和文件的存放路径。2.Data Save with Chart (保存图形的数据) 栏? Save data with the chart:选择此项,保存交互图形时,将生成该图的数据信息一并保存,对于数据量大的数据文件,这种保存方式会大大地增加文件的大小。? Save only summarized data:选择此项,保存交互图形时,只保存概述信息。此项为系统默认选项。3.Print Resolution (打印图形的分辨率) 栏此栏提供了4种分辨率:●
High resolution bitmap:高分辨率位图。●
Medium resolution bitmap:中等分辨率位图。●
Lowre solution bitmap:低分辨率位图。●
VeCtormetafile:向量元文件,即矢量图。4.Measurement Units (度量单位) 栏本栏提供了3种度量单位:points(像素)、inches(英寸)和centimeters(厘米)统默认的度量单位为英寸。如果要求打印高分辨率位图应选择像素作为度量单位。5.Reading Pre-8.0 Data File (读8.0以前的数据文件) 栏.? Assign a scale measurement level if variable 24 unique:对于SPSS 8.0以前的版本创建的数据文件中的数值型变量.,指定一个最小的特殊值用于区分该变量是比例测度的变量还是分类变量,比这个特殊值少的变量作为分类变量,系统默认的这个特殊值为24,可以改变小框里的数值(范围1~999)。凡定义了值标签的变量,将不受此限制。 7
Pivot Table选项卡
Pivot Table选项卡用于设置输出表格的格式。SPSS ll.0提供了五十多种形式的枢轴表样板,在此处选定一种枢轴表样板,以后运行生成的一切表格都将以此种格式输出。1.Table Look (表外观样式) 栏在样式列表栏里提供了枢轴表输出格式文件及存放的路径。统计分析生成的表格都是以Academic.tlo样式输出的。右边Sample (样例) 框里显示选择的该种表格的样式草图。2.Adiust Column Widths for (表列宽调整) 栏● Labels only:按变量标签来确定列宽。● Labels and datas:按变量标签和数据来确定列宽。3.Default Editing Mode (默认编辑模式) 栏可以选择一种编辑表格的方式作为默认表格编辑模式。8
Data选项卡Data选项卡用于设置有关数据的参数。1.Transformation and Merge Options (数据转换和合并) 选项栏● Calculate values immediate:立即进行要求的转换计算同时读取数据文件,此项为系统默认选项。如果数据文件很大,而且要执行多项转换,这种转换可能会耗费大量时间。● Calculate values before use:延迟转换直到遇到命令的时候才执行转换计算和合并,如果数据文件很大,这种转换会显著地节约处理时间。但是,暂时挂起转换将限制在数据编辑器中要做的其他工作。2.Display Format for New Numeric Variables (新的数值型变量的显示格式) 栏设置新定义的数值型变量的宽度(Width)和小数数位(Decimal)。3.Set Century Range for 2-Digit Years (为表示两位数年份设置百年范围) 栏以100年为间隔设置年限,为数据编辑中定义日期型格式的变量时使用,因为日期型变量的定义形式中有用到两位数表示年的形式,如11/30/75、29-OCT-87。? Automatic:自动设置年限范围。Begin year (初始年)为1933年,End year (终止年)为2032年。选择此项,从的100年可分为前69年和后31年两段,在定义两位数年份时,若定义的日期变量值为10/04/02,系统自动地识别为日。 ? Custom:自定义年限范围。在BeSinyear框中任意输入一个(之间)的年份,如1990,Endyear框中的数值自动地调整为2089。9 Currency选项卡Currency选项卡用于设置数值型变量的输出格式。1.Custom Output Formats (自定义输出格式) 栏栏内提供了5种格式,分别为CCA、CCB、CCC、CCD和CCE。2.All Values (所有值) 栏对每种数值型变量的格式,在Prefix (前缀) 框中键入数值的首字符空格;在Suffix (后缀)框中键入数值的尾字符,系统默认值为空格。3.Negative Values (负数值) 栏对每种数值型变量的格式,在Prefix框中键入负数值的首字符,系统默认值为“―”;在Suffix框中键入负数值的尾字符,系统默认值为空格。
4.Decimal Separater (十进制分隔符) 栏本栏确定小数点符号,其中,选择Period,即为小数点为圆点,此项为系统默认。选择Comma,小数点为逗点。上面的参数确定后,按照确定格式表示的数值字样显示在Sample Output栏中,对自定义的数值型变量格式,单击应用按钮加以确认后,待到在数据编辑窗口定义变量时,便可以引用自定义格式的数值型变量了。10
Scripts选项卡Scripts选项卡用于设置启动SPSS用到的脚本程序文件。1.Global procedure (全局处理程序) 栏设置SPSS的全局脚本程序文件,该文件由软件自带,安装SPSS时会自动予以设置,它包含着其他脚2.Autoscripts (自动脚本运行) 栏用于设置是否运行Autoscripts.sbs程序。其中Autoscnpts subroutine status框中列置自动脚要了解各种脚
数据文件的建立及整理统计工作中,统计调查或试验搜集来的数据资料要借助计算机进行分析,首先必须将这些数据资料输入计算机,产生相应的数据文件,建立数据文件是进行统计分析的基础工作。实际中调查得来的数据资料往往是零乱的,为便于统计分析,需要对这些数据进行科学的归纳与整理,文件质量的优劣将会对统计分析结果产生直接的影响。SPSS数据文件的建立、编辑及整理主要由主菜单里File、Data、Transform和Edit菜单里的功能项来实现的。本章介绍这些功能项的使用方法,为利用SPSS进行统计分析作必要的准备。
一、SPSS数据
执行File→Open命令,弹出打开文件对话框,在文件类型框中列出了SPSS ll.0能够读取的文件类型,列于表2.1中。
数据(Data)是SPSS处理分析的主要对象,即数字、字母或符号,可以是某次实验或调查结果的记录等。例:某校教师调查编码后的资料:性别 年龄 科目 工龄 工资 受教育年限 评价等级
.. . .. ... .. .
★ 课堂练习:录入教师调查数据
二、名词解释① 案例(Case):在一组数据中对某一个体记录的一组数据,如编号为1的教师。
② 变量(Variable):在处理过程中其值可以改变的量,如性别、年龄等。 每一变量必须有“变量名”,用英文或拼音,如SEX、AGE等。变量有数值型和字符型,如“评价等级RAT”中的数据也可是“A、B、C”。 ③ 值(Value):即常量数据,如变量SEX的值是1、0、0 ??三、数据输入方法● 文件 → 新建 → 数据文件● 进入“变量观察窗”:(1) 变量名 :SEX、AGE ?(2) 类型:数字(数值型)――宽8位、小数点2位(约定)字符串(字符型)――长度8位(约定)选中修改 单击 ?(3)长度:(可调)(4)小数点:(可调)(5)变量标签:录入中文,如:性别、年龄(6)数值标签:SEX 单击 ? ,弹出对话框: 数值_________ 1数值标签_____男添加SUB 、RAT ??(7)遗漏值: 单击? ,弹出对话框: 离散值或范围(9, 999等)(8)栏宽(9)对齐
(10)测度: 单击? ,刻度(定距)、序数(定序)、名 义(定类)――小图标 ●进入数据观察窗,录入数据SPSS的数据文件里包括变量、观测量等,首先介绍这些基本概念。1.SPSS变量SPSS中的变量与统计学中的变量概念一致,对总体单位而言,它表示统计标志。对总体而言,则表示统计指标。SPSS变量具有以下属性:变量名、变量类型、变量长度、变量标签、缺失值、单元格宽度、对齐格式、测度水平等。(1)Name (变量名)。变量名,即变量名称,定义一个变量首先应当为它命名。SPPP中变量命名的规则如下:
①变量名由不多于8个的字符组成,如果定义的变量名中字符个数大于8,系统将会自动截去尾部作不完全显示。②首字必须为字母,其后可以是字母、符号或数字,也可以使用汉字作为变量名。例如,“N_score”、“产值”。但是有几个特殊字符,如“?”、“!”、“*”以及算术运算符等都是不允许使用的。此外点“.”不能作为变量名的最后一个字符。③变量名中不得使用SPSS的保留字,它们是:ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH④系统不区分大小写字母,例如SCORE、Score、Score视为同一个变量名。(2)Type (变量类型)。SPSS变量有3种基本类型:Numeric (数值型)、String (字符型)和Date (日期型)。系统默认的变量宽度(Width)为8 (即数字,包括小数点或者字母,总数为8),小数点位数为2,例如12345.56、Student、1.25E-08皆为符合要求的变量值。如果要改变系统默认的变量宽度,可以在Option (总选项)对话框中重新设置。数值型变量又可以分为8种不同类型,其中标准数值型变量为系统默认的基本类型。各类型名称、输入格式列于表2.2中。表2.2
系统默认长度下数值型变量的输入与显示格式
分自右向左每3位加一个逗点作为分隔符,用圆点作小数点;带圆点型的数值变量,其变量值的整数部分自右向左每3位加一个圆点作为分隔符,而用逗点作小数点;科学记数法中表示指数的字母用E,也可用D,甚至不用,如2.35E2、2.35E+2、2.35D2、2.35+2都表示235,均显示为2.4E+02。带美元符号($)型,输入时可以不必键入字符“$”,根据指定的变量长度,譬如,定义
变量宽度为11位,则显示时均为
“$***,***.**”。SPSS中,日期型变量值的显示格式非常多,无论选定哪一种具体的格式,输入时都可以使用“/”和“―”作为分隔符,显示时系统会按定义的格式输出。字符型变量的值是一串字符,使用时需特别注意,定义变量名时字母大小写不加区分,但输入字符型变量值(即字符串)时,系统对大写字母和小写字母则是严格加以区别的。
日期型变量和字符型变量不允许参与运算。(3)Variable Labels (变量标签)。变量标签是对变量名的附加说明。SPSS中不超过8个字符的变量名,许多情况下,不足以表达变量的含义。利用变量标签可以对变量的意义作进一步解释和说明。特别地,在中文Windows下还可以附加中文标签,这给不熟悉英文的用户带来很大方便。例如,定义变量名:Name,可以加注标签“姓名(或学生姓名、职工姓名等)”。给变量加了标签以后,在数据窗口工作时,当鼠标箭头指向一个变量的时候,变量名下立即显示出它的标签。(4)Value Labels (值标签,或标签值)。变量值标签是对变量的可能取值附加的进一步说明,通常仅对类型(或分类)变量的取值指定值标签。对变量值附加标签值有重要的作用,例如我们定义一个变量“Departmt”,代表某所大学的系或部门,我们准备将它作为分类变量参与数据文件的统计分析,可以将它定义为一个字符型变量,也可以定义为一个数值型变量。如果将它定义为一个字符型变量,则由于该校有众多的系和部门,在输入观测值时必须输入系或部门名称,这将大大地增加键盘输入的工作量。如果将它定义为一个数值型变量,日后在阅读数据文件的时候,常常又可能不明确变量值的意义。而将各系或部门的名称作为变量的各个值的标签,假如在值标签开关(见2.2.1节)开启的状态下,要输入各系或部门的名称,只需要输入它的值,而在数据窗口变量值的单元格里却显示该变量值对应的值标签,既减轻了输入的工作量,又可以一目了然地了解变量值的意义。例如:将变量Departmt分别定义为字符型和数值型变量时,可以按照下面的表中所列规定它的值和值标签,并设变量标签为“XX大学的系与部门”。
(5)Width (
变量格式宽度指在数据窗口中变量列所占据的单元格的列宽度。应该注意,定义变量类型时指定的宽度和定义变量格式时的宽度是有区别的。定义变量格式宽度应当综合考虑变量宽度和变量名所占的宽度,一般取其较大的一个作为定义该变量格式宽度时可取的最小值。即:“变量格式宽度&=变量宽度”,同时“变量格式宽度&=变量名长度”如果变量宽度&变量格式宽度,那么,在数据窗口中显示变量名的字符数不够,变量名将被截去尾部作不完全显示。输入的数据可能截去尾部,被截去的部分用“*”号代替。(6)Alignment (单元格对齐格式)。在数据窗口中,变量值在单元格的显示有左中右之分,一般情况下,对数值型变量默认的对齐方式为右对齐,字符型变量默认的对齐方式为左对齐,用户可以自行决定对齐方式。(7)Missing Value (缺失值)。统计调查,搜集研究对象的有关统计资料是统计工作的基础。但是在具体工作时,总难免会发生一些失误,例如,须观测的现象没有观测到,或者由于不慎遗失了原始记录,或者由于登记时的疏忽导致记录错误。总之,会因种种原因造成统计资料的残缺、遗漏和差错。
统计中把那些没有观测到,或没有记录到,或者记录结果有明显的错误的数值,称为缺失值。例如,在调查小麦亩产量时,记录到某地的平均亩产为4580公斤,如此高的产量显然违背普通常识的,小麦亩产量不可能达到这样高,这个数据应属于错误的数据,统计分析中使用了这样的数据必然导致错误的分析结果。SPSS提供了处理这些缺失值的功能,以便在统计分析中排除它们。SPSS中,对数值型变量,系统默认的缺失值为0;对字符型变量,默认的缺失值为空格。用户可以自定义缺失值。例如在处理小麦亩产量数据资料时,可以把数值大于1500公斤的数据标记为缺失值。(8)Measurement (测度)。统计学中,所谓测度是指按照某种法则给现象、事物或事件分派一定的数字或符号,通过测度来刻划事物的特征或属性。例如,对人进行测度,其属性或者特征有性别、年龄、身高、体重、职业等。可以用58公斤标识某人的体重,用172米标识他的身高,用1(男)或2(女)标识他(或她)的性别。一般来说,任何事物都具有直接的或者潜在的可测性,但是可测的程度或者水平是不同的,统计学中,通常将测度分为:Scale (定比测度,或比率测度)、Ordinal (定序测度,或顺序测度)、Nominal (定类测度,或名义测度)。认为这3种测度水平以Scale测度的测度水平最高,Ordinal测度次之,Nominal测度的测度水平最低。从统计学的角度,测度选择一般按以下原则进行:①取值于一个区间,或者取值为比率的连续型变量应设置为Scale测度,如职工收入、身高、体重,产品产值、价格等。②无论是数值型变量还是字符型变量,只要资料具有某种内在的顺序分类,如可明显地区分为大、中、小;高、中、低;优、良、中、可、差等,则应设置为Ordinal测度。③资料如果是不具有某种内在顺序分类的字符型变量,如工人的工种、公司里的部门、地理区域划分等,可以设置为Nominal测度。表示明显分类的数值性变量也可以设置为Nominal测度,如将Sex(性别)定义为数值型变量,1:“男”,2:“女”。在SPSS 8.0以后的版本中,测度选择一般规定:当变量定义为数值型变量时,系统默认的测度水平确定为Scale测度,允许用户自行确定3种测度水平一种测度;当变量定义为字符型变量时,系统默认的测度水平确定为Nominal测度,也允许将其测度水平改为Ordinal测度。测度的确定与许多统计分析过程以及图形过程有密切关系。在这些过程中系统需要区分变量是定比测度的变量,或是分类变量。Nominal测度和Ordind测度的变量只作为分类变量来对待。2.观测量SPSS中用Case(s)表示观测量、案例或事件。统计学中指出,构成总体的单位具有各种各样的特征,将这些特征的名称称为“标志”。如某工厂的全体职工组成一个总体,该厂的每个职工为一个总体单位,他们都有姓名、性别、民族、体重、身高、工资等,这些反映职工特征的名称称为标志,这些标志又区分为数量型标志(可用数量来表示的,如体重、身高、工资等)和品质型标志(不能用数量表示的,如性别、民族等)。对每一个职工进行观察,都可以记录到每个标志的一组资料,这组资料在统计学中称为标志的标志表现,对不同的职工将记录到的互不相同的资料,体现了标志的变异性,因此,笼统地称各个特征为变量。如果把对一个职工各种特征的观察视为一个观测量,便可得到反映这个职工具体特征的一组观测值,这一组观测值在SPSS中称为一个Case (观测量)。数据窗口的二维表格中的每一个横行用来存放这一组观测值。因此,把数据窗口的每一个横行就当作为一个Case,表中第m行第n列交叉点处的单元格(Cell)中的数值视为第m个单位的第n个变量的变量值。
四、定义变量在建立SPSS数据文件之前首先要定义变量,即要定义变量名、变量类型、变量宽度、变量标签、变量格式等。为了提高工作效率,建议用户在建立数据文件之前,对掌握的数据资料事先进行一些分析,对需建立的文件从内容、格式、变量名等方面进行通盘的考虑并制定一个简要的计划。为了说明定义变量的步骤,给出某校16名硕士研究生毕业论文答辩结果的资料列于表2.3中。表2.3
研究生毕业论文答辩结果
根据以上资料可以建立一个包含5个变量的数据文件,不难看出,其中“序号”、“评分”应定义成测度水平为Scale数值型变量,“姓名”定义为字符型变量,可以将“性别”、“系别”定义成附有值标签的、测度水平为Ordinal的数值型变量。下面给出定义变量的步骤:单击数据窗口下面的Variables View (变量视图)选项卡,出现定义变量窗口。
1.定义变量名在Name下的单元格中输入变量名,如:Order。
2.定义变量类型及宽度
在Type下选择变量类型,单击该单元格,再单击这个图标中的按钮,打开Variable Type (变量类型) 对话框,从中选择变量类型。例如,选择Numeric (数值型),Width (变量宽度):4,Decimal (小数位数):2。变量的宽度和小数位数也可以在定义变量窗口中的Width 和 Decimal 的单元格中选择,点击箭头可以调大或调小变量宽度的数值。
3.定义变量标签在定义变量窗口中Lable下的单元格中,输入标签字节的变量标签。
4.定义值标签由于只对定序(或定类)变量的值定义值标签,变量Order不需要定义值标9,Values下
面的单元格中显示None (无)。而在定义变量sex (姓别)、Departmt (系别)时就需要定义值标签了。仅以departmt面的单元为例说明。假若已经定义了Departmt为数值型变量,变量标签为“系别”。再单击右边的按钮打开值标签对话框。在Value栏里输入1,在下面的Value Label输入对应变量值的标签,如数学系。最下方较大矩形框为显示值标签清单,当上面两栏里输入了数值、文字或符号时,左边第一个按钮Add(添加)置亮,可单击它或使用热键Alt+A将输入的值标签添加到值标签清单中去,接下来可以输入第二个值标签,其余类推。如果对已经列入清单的值标签不满意,单击它将其置亮,单击左端第三个按钮Remove将其移出。第二个按钮Change为改变标签值按钮,清单中的标签值如不满意也可以先不移出,先在Value栏输入原值,再在Value Label栏中输入新的值,此时Change置亮,单击它更改后的标签值就将代替原来的旧值。5.定义缺失值单击Missing下的单元格,再单击右边的按钮打开缺失值对话框。对话框中有3个单选项:● No missing values:无缺失值,为系统默认选项。● Discrete missing values:离散缺失值,下面有3个矩形框,选中此选项时,矩形栏被激活,在各框中键入可能出现于该变量的观测值中的缺失值,实际输入的数值也可以少于3个。如变量departmt共有从1~9的9个值,分别代表9个系,在3个栏中分别输入0、10。输入这些值是考虑到,在建立数据文件时,可能会由于操作中的疏忽误将这些值输入,当然,这两个值不一定真的会出现在数据文件中,只是作为预防,当系统在进行统计分析时如果真的遇到了这两个值,会将它们作为缺失值对待,可以帮助用户及早地发现错误。● Range plus one discrete missing values:缺失值范围外加一个离散缺失值,选择此项可以给出一个缺失值的范围,Low为下限,High为上限,如果你定义的变量为连续性变量,系统在分析数据时遇到指定的上下限之间的数据,将作为缺失值处理。此选项可以看成前两个选项的结合,意义基本同前面一样。定义了缺失值后,输入变量值时,特别需要注意,自己定义的缺失值无论是离散型的还是连续型的,其值或者它的范围中,绝对不要包括合法值,否则仍将影响分析结果,反而招致不必要的麻烦。一般来说,上面定义的缺失值或缺失值范围内未必能把所有的缺失值全部包括在内,在系统分析时如果发现了定义的缺失值,我们可以返回数据文件将它们修改处理,然后再重新定义其他缺失值或缺失值范围。6.定义列宽度在定义变量窗口中,单击Column下面的单元格,单击向下和向上的箭头按钮选定列宽度。7.定义对齐格式在定义变量窗口中,单击Align下面的单元格,单击箭头按钮展开下拉式列表框,从中选择Left (左对齐)、Right (右对齐)、Center (居中对齐)。8.定义测度水平在定义变量窗口中,单击Measure下面的单元格,出现
,单击箭头按钮展开下拉式列表框选择一种测度。按照上述步骤将各变量定义完毕,如对前面给出的资料,定义5个变量后,定义变量窗口。 单击Data View选项卡返回数据窗口,依据表2.3的资料按变量输入数据建立数据文件。
五、数据文件的保存● 文件 → 保存将数据以指定“文件名”保存在指定文件夹里,如:TEACH SPSS规定数据文件的扩展名为: .SAV定义了变量并输入数据,数据文件就建立起来了。一般可将数据文件保存为SPSS for Windows数据文件,也可以存储为其他格式的数据文件,以便使用其他应用软件时调用。
对于新建的数据文件,执行File→Save as菜单命令,打开Save Data as对话框,指定文件名和保存路径,并选择保存文件的格式保存。SPSS可以保存的数据文件格式有十多种,列于表2.4中。表2.4
SPSS能够存储的文件格式表
例:某校教师调查编码后的资料:性别 年龄 科目 工龄 工资 受教育年限 评价等级
.. . .. ... .. .
★ 课堂练习:录入教师调查数据
六、数据文件以及编辑
1、调入数据文件● 打开 → 数据文件 → (查找→打开)
★ 示例1:教师调查数据文件(FILE1.SAV)★ 示例2:某班20名学生测验语文、外语、数学三科成绩(FILE2.SAV):
★示例3:某校10名学生开展评价实验,前测和后测的数据(FILE3.SAV)注:录入代码(Code),测验分数(S),注意观察录入格式。
★示例4: 某校对两班各30名学生组织了一次评价测试活动(FILE4.SAV) 对照班 实验班
?注:注意观察录入格式。2、数据编辑(1)插入变量
● 调入TEACH.SAV 文件● 将光标定位于插入点(后一变量),点黑 → 数据 →插入变量执行Data→Insert Variabule命令。(2)插入案例● 将光标定位于插入点(后一案例),点黑 → 数据 →插入案例执行Edit→Insert Case命令。(3)删除变量(或案例)● 将光标定位于变量(案例),点黑 → 编辑 → 清除执行EdR→Clear (清除)命令,或者按键盘上的Delete键,则删除掉变量就再也不能恢复了。(4)单元中数据的编辑如果发现某个单元格中的数据有错误,只要找到这个单元格,将正确的数据重新输入就可以了。如果单元格的数据正确而是输入的位置错误,剪切该数据。用鼠标选中准备操作的单元格,将它粘贴过来。
(5)上述操作均可用鼠标右键快速进行。
(6)按观测量序号查寻单元格的位置数据文件已经建立完毕,如果想寻找查看或者修改某单元格中的数据,当文件中有许多观测量、变量,包含大量的数据时,在有限的屏幕窗口里无序地查找,显然不是一个好方法。例如,我们打开一个记录着某机械厂429名职工有关信息的数据文件。现在需要查看序号为256号职工的资料,具体方法如下:(1)执行Data→Go To Case (定位到观测量)命令。展开如图2―1所示的Go To Case 对话框。
定位到观测量对话框(2)在对话框中输入要查找的观测量序号:如256,单击OK按钮。在观测量序号列中,一个虚线框就将256号观测量框住,并将256号观测量置于数据区域的顶端。
(7)按变量查寻单元格的位置如果要查找当前工作文件中某变量的一个变量值,按照下述方法在变量列里纵向查寻。仍以文件“东方机械厂.Sav”为例,假如需要查看变量workage(工龄)为35年的变量值,具体方法如下:
(1)用鼠标选中变量workage的任意单元格,执行Edit→Find (查寻)命令(热键Ctrl+F),展开Find Data in Variable...(在变量?查寻数据)对话框。(2)在Find文本框中输入要查找的变量值35,单击Find Next按钮。如果找到这个值,则定位到该变量值所在的单元格,如果需要进一步查寻,继续单击Find Next按钮。若查寻中未发现这个变量值,系统将通报用户“35 Not found”(没找到35)。选项Match case用于查找字符型变量值时,决定是否区分字符串中字母的大小写。选择此项,查寻时将视变量值中大小写字母相同的字符串为相等的。最后需要说明,对数值型变量,由于定义了变量宽度和小数位的关系,数据文件里单元格中显示的数值是经四舍五入后的近似数值,与变量的内部值(即在数据输入栏中显示的数值)是不同的。在SPSS早期版本中,查寻数据时是按显示格式进行的。如在Find框里输入1.87,而具有值为1.87的单元格里的内部变量值实际上可能会大于或者小于1.87,查寻时只要显示成1.87而不管其内部值是多少都认为找到了。而在SPSS 11.0中却是按照变量的真实数值来查寻的。
(8)文件变量信息的查阅用户在定义变量、建立并保存数据文件的同时,变量及文件的相关信息也同时被保存下来。在对数据资料进行输入、编辑、修改分析的时候经常需要了解这些信息。SPSS为用户提供了方便的变量信息查阅功能。查阅变量信息的方法是:执行Utilities→Variable (变量) 命令,展开记录当前工作文件中各变量的信息框。变量信息框左边为文件中变量列表,单击列表中一个变量名,该变量的定义信息就显示在右边的矩形框中。矩形框每次只能显示一个变量的信息。矩形框下有4个按钮:单击Go To按钮,返回数据文件窗口,且被选中的变量成为当前变量,选中单元格定位到该变量列中。信息框内显示的变量信息只容查看不能复制,用户要了解文件中所有变量的信息,可以执行Utilities―Filelnfo(文件信息)命令,系统打开输出窗口,文件的全部变量信息列于一表中显示出来。表2.5是记录一个工厂职工情况的数据文件的所有变量信息表(局部)。
七、利用SPSS进行统计处理的基本过程SPSS功能强大,但操作简单,这一特点突出地体现在它统一而简单的使用流程中。SPSS进行统计处理的基本过程如图6-1所示:
(一)数据的录入
将数据以电子表格的方式输入到SPSS中,也可以从其它可转换的数据文件中读出数据。数据录入的工作分两个步骤,一是定义变量,二是录入变量值。
(二)数据的预分析
在原始数据录入完成后,要对数据进行必要的预分析,如数据分组、排序、分布图、平均数、标准差的描述等,以掌握数据的基本特点和基本情况,保证后续工作的有效性,也为确定应采用的统计检验方法提供依据。
(三)统计分析
按研究的要求和数据的情况确定统计分析方法,然后对数据进行统计分析。(四)统计结果可视化
在统计过程进行完后,SPSS会自动生成一系列数据表,其中包含了统计处理产生的整
套数据。为了能更形象地呈现数据,需要利用SPSS提供的图形生成工具将所得数据可视化。如前所述,SPSS提供了许多图形来进行数据的可视化处理,使用时可根据数据的特点和研究的需求来进行选择。
(五)保存和导出分析结果
数据结果生成完之后,则可将它以SPSS自带的数据格式进行存贮,同时也可利用SPSS的输出功能以常见的数据格式进行输出,以供其它系统使用。
数据输入和输出
在使用SPSS软件进行数据分析时,首先要建立数据文件。通常一个数据文件的建立可以包括定义变量、数据输入、数据的简单计算、数据文件的保存和输出等内容。一、变量的定义输入数据前要定义变量,包括定义变量名、变量类型、变量宽度、变量标签和变量格式。定义变量的步骤如下:
1.打开定义变量的界面启动SPSS,进入主界面,单击图6-2所示的屏幕左下角的“Variable View”选项卡,打开定义变量的表格。
2.输入变量名
在“Name”列的第一个单元格输入第一个变量名,如 “编号”。SPSS 10.0支持中文变量名。
3.确定变量类型
单击“Type”列的第一个单元格,如图6-3所示,SPSS的默认变量类型为数值型。单击数值型变量后的“的变量类型。 ”,弹出如图6-4所示的对话框,用户可以从该对话框中选择其他
在图6-4的对话框中列出了8种可选的基本变量类型:数字型(Numerric)、逗号型(Comma)、句点型(Dot)、科学计数型(Scientific notation)、日期格式型(Date)、美元型(Dollar)、定制货币型(Custom Currency)和字符串型(String)。
4.设置变量的其他属性
在图6-3所示的表格中,“Width”表示变量的总宽度,“Decimal”表示小数位数,“Lable”表示变量标签,“Value”表示变量的值,“Missing”表示缺失值,“Alignment”表示对齐方式,“Measurement”表示变量的种类。这些属性如果不是特殊需要,一般不要进行修改。二、数据的输入
定义好变量后,单击“Variable View”选项卡旁的“Data View”选项卡,进入数据输入窗口,按照SPSS表格直接输入数据即可。三、数据的简单计算当输入完数据后,有时要根据已经存在的变量建立新变量,可以使用Compute来完成。
1.选择“Transform→Compute”命令,弹出“Compute Variable”对话框,如图6-5所示。
2.在Target Variable框中输入新的目标变量名,用来接收计算的值。
3.利用Numeric Expression(计算关系板)下面的框中输入计算新变量的数字表达式。方法如下:
(1)在左侧选择原始变量名进入Numeric Expression
(2)在Numeric Expression上选择数字或操作符,形成表达式,如“编号&=10”(3)在函数框中选择表达式需要的函数,使表达式出现在其后括号中。如图6-6所示。
(4)单击“OK”按钮,生成新的变量。四、保存数据文件
在查看器窗口中,进行以下操作,保存数据内容:
1.单击主菜单中的File菜单,打开File菜单条。
2.单击Save选项,弹出“Save Data As”对话框。
3.输入文件名称,SPSS保存的文件类型为“*.sav”,单击“保存”按钮。五、数据与统计结果的输出
SPSS的文件输出是指将统计分析后的数据与结果以表格或图形的形式显示出来。如图6-7所示,为SPSS的输出窗口。在窗口的右侧以图表的形式显示输出结果。
SPSS可以对输出的文件进行保存,保存的类型为“*.spo”。
如果要单独保存表格或是图形,就在其上单击鼠标右键,选择相应的复制命令,将表格或图形输出。SPSS支持的表格或图形的输出格式有很多种,根据选择的输出方式不同,输出文件的格式也不同,一般可以保存为:*.htm、*.jpg、*.tif、*.bmp、*.png等。在本章中,结合教育技术学研究中常用的统计方法,介绍SPSS在统计描述、统计检验和统计分析等方面的应用,供学习者和教育技术研究人员参考使用。
利用SPSS进行统计描述一、统计描述方法在教育技术研究过程中收集到大量的资料数据,但从这些杂乱无章的资料中,很难对其总体水平与分布状况做出评价判断。因此,必须采用一些适当的方法对这些资料进行处理,使之简约化、分类化、系统化,从中发现它们的分布规律,掌握总体的特征,以便对其水平做出客观的评价。
统计描述方法,是研究简缩数据并描述这些数据的统计方法。将搜集来的大量数据资料,加以整理、归纳和分组,简缩成易于处理和便于理解的形式,并计算所得数据的各种统计量,如平均数、标准差、以及描述有关事物或现象的分布情况、波动范围和相关程度等,以揭示其特点和规律。
(一)数据资料的整理和表示
在教育技术研究中,我们用各种方法搜集来的资料,一般是零散的,它只反映个别现象的个别特征,必须经过整理加工,使之系统化,才能计算统计指标,进行统计分析,为进一步研究提供有用的信息,首先要进行的是统计整理,它包含以下几部分内容:1.数据检查
主要检查数据的完整性与正确性。统计资料完整性的检查,就是要根据调查项目检查是否填写齐全,避免遗漏,删去重复。正确性检查,就是检查搜集的资料是否真实可靠。特别是统计数字的真实性是统计工作的生命,统计资料的检查整理必须抓紧这一环。数据检查可分为逻辑检查和计算检查两种方法。逻辑检查,是从理论和一般常识上来检查资料内容是否合理,指标之间是否矛盾。计算检查是检查统计数字在计算方法和计算结果上有否错误。
2.数据分类
数据分类就是把搜集来的数据进行分组归类。数据分类要做到既不重复、不遗漏,又不混淆,一般又可分为品质分类和数量分类。
品质分类:是按事物性质划分为不同的组别、种类。如以性别为标志可分为男与女;
按“理解能力”、“学习态度”等为标志,又可分为好、较好、一般、差等几种水平,每种水平可看成类,每一类可给以相当的数量。可以通过各类所包含的数据再进行数量化的比较和分析。
数量分类:是按数量的属性分类。有顺序排列法、等级排列法和次数分布法等。⒊ 数据的排序
数据排序:将各数据从大到小或从小到大进行排列。这样就可以看出最高分和最低分是多少,各分数出现的次数和位于中间的是什么数等。包括等级排列和次数排序。等级排列:即根据顺序排列划分等级。但与顺序排列不同,它是按数值所含的意义确定的。若是学习成绩,应以数值大的排为第一等级;若是反映时间,则将最小的数值排为第一等级。
次数排序:即根据在指定的数值范围内,数据出现的频数大小排序。
⒋ 数据统计表
就是把所研究的教育技术现象和过程的数字资料,以简明的表格形式表现出来。它可以避免文字的冗长叙述,便于比较各项目之间的相互关系,便于总计、平均和其他统计值的计算,便于检查计算错误和项目遗漏。
⒌ 数据的图示法
数据的图示法是利用几何图形或其他图形等的描绘,把所研究对象的特征、内部结构、相互关系和对比情况等方面的数据资料,绘制成整齐简明的图形。它是用以说明研究对象和过程的量与量之间对比关系的一种方法。它能准确地表现统计资料,有助于对统计资料进行比较、对照、分析和研究。图示法,具有直观、形象,便于记忆和思考以及表达语言难以说清的内容之优点。
在教育技术研究中常用的有条形图、曲线图、直方图和圆形图等,其绘制方法是大家所熟知的,这里不作介绍。
(二)特征参数的计算
为了分析研究对象总体的特征,不必对总体中每一个单位都进行研究。而是通过抽样
方法,按照随机性原则,从全部对象中,只抽取部分单位(样本组)加以研究,对于每组样本,首先应对其基本特征参数进行计算,以给出整体特征的统计描述。并根据统计数据,对总体对象作出具有一定可靠程度的估计和推测。常用的特征参数包括:
⒈ 集中量数
(1)算术平均数,用表示,设为各次观察的结果,则有:
上式中,(2)中数,是指一组按大小顺序排列起来的量数中的中间点的数,又称中位数,用Mdn来表示。
(3)众数,是指一列数中出现次数最多的数值,常用M表示。
2.差异量数
表示平均分表示每个学生的得分,n表示学生人数。集中量数在量尺上是一个点,表示各量数所在的位置。差异量数在量尺上是一段距离,表示一个量数与另一个量数或中心点之间的距离。只有知道了差异量数的大小,才能了解集中量数的代表性如何。差异量数愈大,集中量数的代表性愈小;差异量数愈小,则集中量数的代表性愈大。
在统计分析中经常应用的是标准差,它是与平均数的差数的平方和的平均数的算术平方根。
上式中,S为标准差
)先求出各数据与平均分的离差(2)求各个离差的平方和(3)将
3.标准分数
,为每个学生的得分与平均分的离差,上述公式计算步骤如下:
; ; 除以n再开方,即得标准差。标准分数的计算公式:
公式中x-原始分数,
(三)次数分布
-平均分数,S-标准差。一般采用次数分布表、次数分布直方图或次数分布曲线来表示。
【例6-1】 现有50名学生的成绩,原始数据如表6-1所示:(n=50)
1.次数分布表
为了显示该组样本在不同分数段中的次数分布情况,我们对该数组进行次数分布统计,编制出该数组的次数分布表。方法如下:
(1)求全距:最大数-最小数=98-51=47(2)定组数,一般10-20组为宜。(3)定组距,组距=(全距+1)/组数=(47+1)/10=4.7(取5)(4)定组限,95-100,90-95,85-90??等(5)求组中值:组中值=(上限+下限)/2,如95-100一组,其组中值=(100+95)/2=97.5(6)归类
把原始数据,分别归到相关组中,得出次数分布表如表6-2所示:
2.次数分布曲线
根据这个次数分布表,可绘出对应的次数分布直方图、次数分布曲线和积累次数曲线,分别如图6-8、图6-9和图6-10所示。为了分析次数分布曲线的特征,我们可以把它与正态分布曲线相比较来进行研究。
3. 正态分布曲线
正态分布是一种理论分布,在次数分布中,中间的次数多,由中间往两边的次数逐渐减少,且两边的次数多少是相等的。根据正态分布绘成的曲线称为正态分布曲线,正态分布曲线形状如钟形,它的特点是中间成一高峰,由高峰向两侧逐渐下降,先向内弯,后向外弯,降低的速度是先慢后快,以后又再次减慢,最后达到接近底线,但永远不与底线相接,形成一个单峰的对称的钟形形态,如图6-11所示。
正态分布曲线的形状和位置由平均分置, 和标准差S所决定。平均分 对应于单峰位越大,曲线越往右移动。标准差S越大,曲线的单峰高度越低,宽度越大,显得越“胖”;S越小,曲线的高度越高,宽度越小,显得越“瘦”。如图6-5所示。
在正态分布曲线图上,正态曲线以下,以S为距离单位所包括的面积是按一定比例分配的,若将正态曲线底边从-3S到3S分成四等分,每等分距离为1.5S,则每距离间隔之间所包括的面积比例如表6-3和图6-12所示。
利用正态分布曲线这些性质,我们可以得到划分不同学习水平等级的界限和学生人数比例的理论数值。例如对于常态=75,S=10的情况,其优、良、中、差各等级的分数范围和人数比例应如表6-4所示(N=30)。按照上述方法,对于一个给定的样本组N=3其平均分0,得知=83,标准差S=7.78,我们便可以得到学习水平等级的划分界线,并将人数比例的理论数和实际数相比较,如表6-5所示。
根据图6-12和表6-4,我们便可以得到如下结论:
(1)样本组的峰值位置位于的右侧,属于正偏态的情况。(2)样本组的水平等级标准较高,分数要在94.7以上才能达到优等,而在71.3以下便认为是差等。(3)样本组中优、良等级的实际人数(1+17)要比理论数(15人)所占的比例为多。因此可以认为该总体属于平均水平较高的整体。二、-S平面特征数据分析模型为了综合地、直观地考察样本组的整体统计特征,我们给出一个如图6-13。模型中的横坐标表示平均分的大小(坐标原点以常态作参考标准(-S平面分析模型,),而纵坐标则表示标准差(S)的大小,、S两个参数,可以确定样本组落在=75,S=10)。用平面的某一个象限,而不同的象限,将代表样本组具有不同的统计特征。为了说明各象限所代表的意义,表6-6给出了四组不同特征的数组,它们将分别位于不同的象限,具有不同的特点。利用平均分特征。 和标准差S所在的位置,我们可以直观地看到样本组成绩的统计
【例6-2】 某班语文平均考试成绩为74分,标准差8分。甲学生得90分,乙学生为72分。通过标准分数的计算可以得知他们在全体同学中所出的位置。
1 2 3 4 5 6 7 8 9 10 11 1 1 1 1 1 1 1 1 1 1 1 87 82 79 90 42 78 80 81 84 90 89 13 14 15 16 17 18 19 20 21 22 23 2 2 2 2 2 2 2 2 2 2 2
92 80 89 86 81 90 79 78 85 80 83
操作步骤:⒈ 录入数据
录入数据的过程分为两个步骤,一是定义变量,二是录入变量值。
(1)定义变量:“学号”、“组别”与“成绩”。
(2)录入变量值:在数据编辑窗口中,按照表1的内容,将各变量值一一录入。录入后的部分界面如图6-14所示。
⒉ 数据的等级排序
(1)选择“Data→Sort Cases”命令,弹出“Sort Cases”对话框,把“成绩”变量选入“Sort by”中,并在Sort Order中选择“Descending(降序)”选项,将学生成绩按降序排列,如图6-15所示,单击“OK”按钮。
(2)排序结果
排序结果在数据编辑窗口可以即时浏览,如图6-16所示,并可以通过选择“File→Print?”命令,将结果打印输出。
⒊ 平均分与标准差的计算
(1)计算总平均分与标准差
① 选择“Analyze→Descripitive Statistic→Descripitives?”命令,弹出“Descripitive”对话框,从左侧将“成绩”变量选入“Variables”栏中,如图6-17所示。
② 单击“OK”按钮,提交运行,输出结果如表6-8所示。
(2)分别计算两组学生的平均分和标准差
由于录入数据时两组数据是混合一列,所以在统计之前要将两组学生的数据拆分,在进行统计处理。
① 数据拆分
选择“Data→Split File?”命令,弹出“Split File”对话框,激活“Organize by group”选项,从左侧选择“组别”变量进入“Groups Based on”栏目,最后激活“Sort the file by grouping variables”选项,如图6-18所示。单击“OK”按钮。
② 与计算总平均分与标准差相同,选择“Analyze→Descripitive Statistic→Descripitives?”命令,弹出“Descripitive”对话框,从左侧将“成绩”变量选入“Variables”栏中。如图6-17所示。
③ 单击“OK”按钮,提交运行,输出结果如表6-9所示。
⒋ 统计特征分析
根据SPSS的统计处理所得结果如表6-10所示。
1 82 11 76 21 85 31 87 41 71 2 58 12 57 22 92 32 60 42 54 3 93 13 80 23 83 33 83 43 93 4 89 14 60 24 88 34 84 44 75 5 72 15 89 25 65 35 68 45 90 6 85 16 51 26 82 36 84 46 66 7 97 17 75 27 73 37 84 47 77 8 98 18
60 28 86 38 89 48 63 9 56 19 74 29 86 39 94 49 86
(1)选择“Transform→Recode→Into Different Varibles?”命令,弹出“Recode into Different Variables”对话框,将“成绩”选入“Numeric Variable”框中,并在“Output Variable”中输入新变量的名字“分组”,单击框后的“Change”按钮,如图6-19所示。
(2)单击“Old and New Values?”按钮,弹出“Recode into Different Variables:Old and New Values”对话框。
在对话框中左侧第二个“Range”框中输入60,然后在“New Value”框中的“Value”后输入1,单击“Add”按钮,右侧的文本框中显示“Lowest thru 60→1”,表示用1代表60以下的分数。
在第一个“Range”框中输入“60”though“70”,然后在“Value”后输入2,单击“Add”按钮加入,即用2代表60到70之间的分数。同样,用3代表70到80之间的分数,用4代表80到90之间的分数。
在第三个“Range”框中输入“90”,然后在“New Value”框中的“Value”后输入5,单击“Add”按钮加入,即用5代表90以上的分数。设置完成后如图6-20所示。
(3)单击“Continue”按钮,回到图11的对话框中,单击“OK”按钮,生成新的变量“分组”,界面如图6-21所示。
3.统计分析
(1)选择“Analyze→Descriptive Statistic→Frequencies”命令,弹出“Frequencies”对话框,从左侧选择“分组”,使其进入“Variable(s)”框中,如图6-22所示。
(2)选中“Display frequency tables”复选框,表示显示次数分布表。
(3)单击“Statistics”按钮,弹出“Frenquency:Statistics”对话框,视需要进行选择,如图6-23所示。本例中采用默认值,设置完成后单击“Continue”按钮。
将各部分解释如下:o Percentile Values复选框组 定义需要输出的百分位数,可计算四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cut points for
equal groups)、或直接指定某个百分位数(Percentiles),如直接指定输出P2.5和P97.5。
o Central tendency复选框组 用于定义描述集中趋势的一组指标:均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)。o Dispersion复选框组 用于定义描述离散趋势的一组指标:标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)。o Distribution复选框组 用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis)。o Values are group midpoints复选框 当你输出的数据是分组频数数据,并且具体数值是组中值时,选中该复选框以通知SPSS,免得它犯错误。
(4)在图6-22所示的对话框中,单击“Charts”按钮,弹出“Frenquencies:Charts”对话框,如图6-24所示。本例中选择“Histograms”(直方图)和“With normal curve”(带有正态曲线)两项,单击“Continue”按钮。Charts对话框,用于设定所做的统计图。o Chart type单选钮组 定义统计图类型,有四种选择:无、条图(Bar chart)、圆图(Piechart)、直方图Histogram),其中直方图还可以选择是否加上正态曲线(With normal curve)。o Chart Values单选钮组 定义是按照频数还是按百分比做图(即影响纵坐标刻度)。
(5)在图6-22所示的对话框中,单击“Format”按钮,弹出“Frenquencies:Format”对话框,如图6-25所示。本例中取默认值,设置完成后单击“Continue”按钮。 Format对话框,用于定义输出频数表的格式,不过用处不大,一般不管。o Order by单选钮组 定义频数表的排列次序,有四个选项:Ascending values为根据数值大小按升序从小到大作频数分布;Descending values为根据数值大小按降序从大到小作频数分布;Ascending counts为根据频数多少按升序从少到多作频数分布;Descending counts为根据频数多少按降序从多到少作频数分布。o Multiple Variables单选钮组 如果选择了两个以上变量做频数表,则Comparevariables可以将他们的结果在同一个频数表过程输出结果中显示,便于互相比较,Organize output by variables则将结果在不同的频数表过程输出结果中显示。o Suppress Tables more than...复选框 当频数表的分组数大于下面设定数值时禁止它在结果中输出,这样可以避免产生巨型表格。
(6)在图6-22所示的对话框中,单击“OK”按钮,提交运行,输出结果如表6-11所示。
4.结果分析
根据表6-11的输出结果可知,在60分以下的有8人,60-70分之间的有6人,70-80分之间的有12人,80-90之间的有18人,90分以上的有6人。
分析实例(课堂练习)某地101例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数CV、中位数M、p2.5和p97.5(卫统第三版p233 1.1题)。4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.214.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.444.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.324.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.554.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.644.34 5.18 6.14 3.24 4.90 3.05解:为节省篇幅,这里只给出精确频数表的做法,假设数据已经输好,变量名为X,具体解法如下:1. Analyze==&Descriptive Statistics==&Frequencies2. Variables框:选入X
3. 单击Statistics钮:4.
选中Mean、Std.deviation、Median复选框5.
单击Percentiles:输入2.5:单击Add:输入97.5:单击Add:6.
单击Continue钮7. 单击Charts钮:8.
选中Bar charts9.
单击Continue钮10. 单击OK第五章
利用SPSS进行T统计检验
。一、统计检验的基本原理统计检验是先对总体的分布规律作出某种假说,然后根据样本提供的数据,通过统计μ1和μ2)有没有差异,其步骤为:1.建立虚无假设,即先认为两者没有差异,用2.通过统计运算,确定假设⒊ 根据P 的大小,判断假设成立的概率P。 是否成立。如表6-12所示。 表示;
二、大样本平均数差异的显著性检验――Z检验Z检验法适用于大样本(样本容量小于30)的两平均数之间差异显著性检验的方法。它是通过计算两个平均数之间差的Z分数来与规定的理论Z值相比较,看是否大于规定的理论Z值,从而判定两平均数的差异是否显著的一种差异显著性检验方法。其一般步骤:
第一步,建立虚无假设,即先假定两个平均数之间没有显著差异。
第二步,计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法。(1)如果检验一个样本平均数(其Z值计算公式为:
)与一个已知的总体平均数()的差异是否显著。
是检验样本的平均数; 是已知总体的平均数;S是样本的方差;n是样本容量。
(2)如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。其Z值计算公式为:
1、2是样本1,样本2的平均数; 是样本1,样本2的标准差; 是样本1,样本2的容量。
第三步,比较计算所得Z值与理论Z值,推断发生的概率,依据Z值与差异显著性关系表作出判断。如表6-13所示。
第四步,根据是以上分析,结合具体情况,作出结论。【例6-5】某项教育技术实验,对实验组和控制组的前测和后测的数据分别如表6-14所示,比较两组前测和后测是否存在差异。
由于n>30,属于大样本,应采用Z检验。由于这是检验来自两个不同总体的两个样本平均数,看它们各自代表的总体的差异是否显著,所以采用双总体的Z检验方法。计算前测Z的值
= -0.658∵=0.658<1.96∴ 前测两组差异不显著。再计算后测Z的值
= 2.16>1.96∴ 后测两组差异显著。三、小样本平均差异的显著性检验――t检验
t检验是用于小样本(样本容量小于30)时,两个平均值差异程度的检验方法。它是用t分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。其一般步骤如下:
第一步,建立虚无假设
第二步,计算统计量t值,对于不同类型的问题选用不同的统计量计算方法。(1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量t值的计算公式为:
,即先假定两个总体平均数之间没有显著差异。
(2)如果要评断两组样本平均数之间的差异程度,其统计量t值的计算公式为:
第三步,根据自由度df= n-1,查t值表,找出规定的t理论值(见附录)并进行比较。理论值差异的显著水平为0.01级或0.05级。不同自由度的显著水平理论值记为t (df)0.01和t (df)0.05
第四步,比较计算得到的t值和理论t值,推断发生的概率,依据表6-15给出的t值与差异显著性关系表作出判断。
1 75 11 65 21 66 31 67 41 81 2 66 12 83 22 56 32 76 42 80 3 84 13 72 23 78 33 68 43 70 4 80 14 77 24 56 34 65 44 80 5 92 15 69 25 78 35 63 45 60 6 74 16 64 26 45 36 64 46 82 7 70 17 81 27 89 37 67 47 83 8 88 18 77 28 78 38 69 48 69 9 90 19 73 29 67 39 68 49 63
(2)单击“OK”按钮,提交运行,输出结果如表6-17所示。
3.结果分析
t检验的结果为t值(t)、自由度(df)、双尾显著性概率(Sig.)、均值差异(Mean Difference)和均值差异的95%置信区间(95% Confidence Interval of the Difference)。查t值表可知,t(df)0.05=t(19)0.05=2.093,
而样本 t = 38.544& t(19)0.05
所以样本与总体之间存在显著差异,样本平均分高于总体平均分。
四、One-Sample T Test(单个样本T检验)1、单个样本的T检验单个样本的T检验法的步骤如下:(1)打开或建立数据文件,执行Analyze→Compare Means→One-Sample T Test (单个样本T检验)命令,打开One-Sample T Test对话框。①从源变量清单中选择一个或几个数值型变量移入Test Variables (检验变量)框。②在该框下的Test Value框里输入一个指定值(即假设检验值从),这相当于假设检验问题中提出的原假设Ho:μ=μ0。T检验过程将对每个检验变量分别检验它们的平均值与这个指定数值之间的差异。(2)单击Options按钮,打开选项对话框。在此对话框里可以设置置信概率及缺失值的处理方式。① 在Confidence Interval (置信区间)栏里输入1~99(%)中的一个数值,输出结果给出样本均值与指定的检验值此之差的置信水平该数值的置信区间。系统默认的置信水平为95%。② 在Missing Values栏中有两个选项:●
选择Exclude cases analysis by analysis,只排除分析变量的缺失值。 ●
选择Exclude cases listwise,将剔除有缺失值的所有观测量。 (3)选项确定后,单击OK提交系统运行。2
单个样本T检验实例与分析例6.3.1 从某厂第一季度生产的3批同型号的电子元件中分别抽取了15个、25个和30个样品测量了它们的电阻(单位:欧姆),以判断各批产品的质量是否合格,数据资料如表6.1所示。表6.1
3批元件的样品电阻测量值
按质量的规定,元件的额定电阻为0.140欧姆,假定元件的电阻服从正态分布。根据这3批元件中抽检的样品的电阻测量值,用T检验过程检验,这3批产品是否合乎质量要求?
操作步骤如下:(1)根据表6.1资料,定义变量Ohml、Ohm2、Ohm3,将这3个样本的数据作为3个变量的观测值,建立数据文件,并以文件名Ohm.sav保存。
(2)选择检验变量Ohml、Ohm2、Ohm3移入Test Variables框;输入假设检验值为0.140。
(3)由于3个检验变量的样本容量互不相同,在选项对话框里,缺失值处理方式选障Exclude cases analysis by analysis。置信水平采用系统默认的95%。
(4)单击OK,提交系统运行。
(5)输出结果及其统计分析如下。①单个样本的统计量表,如表6.2所示。表中分别给出3个样本的容量(N)、均值、标准差和平均标准差。表6.2
One―Sample Statistics (单个样本的统计量)表OHMl
NMeanStd.Diviadon Std.Error Mean ..第1批元件样本电阻值(欧姆) 15 0.14200OHM2 第2批元件样本电阻值(欧姆) 20 0.14115 OHM3 第3批元件样本电阻值(欧姆) 30 0.13907②一个样本均值的T检验表,如表6.3所示。表6.3
One-Sample Test (单个样本的检验)表 Test Value = 0.140
O HMl第1批元件样本电阻值(欧姆) OHM2第2批元件样本电阻值(欧姆)t 2.898 1.583df 14 19sig. .012 .130 .265Mean .0
-.0009395%C.I of the Difference Lower .0 .00261Upper .0 .00075(2-tailed) DifferenceOHM3第3批元件样本电阻值(欧姆) -1.137 29从表6.3看到,对于第一批元件样本电阻测量值,有 ● T统计量值t=2.898;● Df (自由度)为14,自由度等于样本容量减1;●
双尾T检验的显著性概率Sig(2-tailed),其意义为:Sig.=0.012& 0.05,说明第一批元件的平均电阻与额定电阻值0.140有显著的差异。●
Mean Difference (均值差),即样本均值0.14200与检验值0.140之差为0.00200。
样本均值与检验值偏差的95%置信区间 (95% Confidence Interval of the Difference)为(0.048),置信区间不包含数值0,则说明以95%的置信概率样本值与检验值偏差大于零。根据上述结果,对第一批元件样本,应拒绝原假设,即认为第一批元件的电阻不符合[量要求。与额定电阻值0.140相比,这批产品的电阻显著地大了些。对于第二批和第三批元件,显著性概率Sig.&0.05,所以接受原假设,认为这两批元件的电阻与额定值无显著差异,即认为产品合乎质量要求。需要指出,单个样本的T检验法中,给出的置信区间是样本均值与检验值偏差的95%置信区间,并非总体均值的95%置信区间。要求出总体均值的置信区间,只要在对话框的Test Value框里输入假设检验值μ1 =0即可。本例中,可以求得3批元件总体均值的95%置信区间分别为:
(0.148)、(0.167)、
(0.175)。显然,这些置信区间正是偏差的95%置信区间的上下限加上检验值0.140的结果。
五、Independent-Samples T Test过程1 主要功能
调用此过程可完成两样本均数差别的显著性检验,即通常所说的两组资料的t检验。2 实例操作[例5.2]分别测得14例老年性慢性支气管炎病人及11例健康人的尿中17酮类固醇
数据准备激活数据管理窗口,定义变量名:把实际观察值定义为x,再定义一个变量group来区分病人与健康人。输入原始数据,在变量group中,病人输入1,健康人输入2。结果如图5.3所示。
两组资料t检验的原始数据
统计分析激活Statistics菜单选Compare Means中的Independent-samples T Test...项,弹出Independent- samples T Test对话框(如图5.4示)。从对话框左侧的变量列表中选x,点击?钮使之进入Test Variable(s)框,选group 点击?钮使之进入Grouping Variable框,点击Define Groups...钮弹出Define Groups定义框,在Group 1中输入1,在Group 2中输入2,点击Continue钮,返回Independent-samples T Test对话框,点击OK钮即完成分析。
Independent-samples T Test对话框
结果解释在结果输出窗口中将看到如下统计数据:
这一部分显示两组资料的例数(Numbers of cases)、均数(Mean)、标准差(SD)和标准误(SE of Mean),显示两均数差值为1.1503,经方差齐性检验:
P= .514,即两方差齐。
这一部分显示t检验的结果,第一行表示方差齐情况下的t检验的结果,第二行表示方差不齐情况下的t检验的结果。依次显示值(t-value)、自由度(df)、双侧检验概率(2-Tail Sig)、差值的标准误(SE of Diff)及其95%可信区间(Cl for Diff)。因本例属方差齐性,故采用第一行(即Equal)结果:t=1.81,P=0.084,差别有显著性意义,即老年性慢性支气管炎病人的尿中17酮类固醇排出量低于健康人。
六、Paired-Samples T Test过程1 主要功能调用此过程可完成配对资料的显著性检验,即配对t检验。在医学领域中,主要的配对资料包括:同对(年龄、性别、体重、病况等非处理因素相同或相似者)或同一研究对象分别给予两种不同处理的效果比较,以及同一研究对象处理前后的效果比}

我要回帖

更多关于 spss图形编辑 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信