spss如何进行异常值替换

如何使用spss替换缺失值一起来看看具体的设置方法。

  1. 例如该组数据有两个缺失值

  2. 点击转换,选择替换缺失值

  3. 在该表格中可以看到结果变量。

  4. 返回页面缺失值已被序列均值替换。

经验内容仅供参考如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域专业人士

作者声明:本篇经驗系本人依照真实经历原创,未经许可谢绝转载。

说说为什么给这篇经验投票吧!

只有签约作者及以上等级才可发有得 你还可以输入1000字

}

在SPSS软件里有2种不同的删除方法整条删除和成对删除。

当然这种方法简单易行,但缺点也很明显首先我们经常会遇到的情况是观测值很少,这种删除会造成样本量不足其次,直接删除的观测很多也可能会改变变量的原有分布,从而造成统计模型不够稳定

   (2)暂且保留,待结合整体模型综合分析

通常我们观测到的异常值有时在对于整个模型而言,其异常性质并没有观测到的明显因此最好综合分析一下,像回归分析我们经常利用残差分布信息来判断模型优劣,残差有没有超出经验范围(+3标准差)呈现什么分布等,另外对于整个模型而言会有一些指标像Mahalanobis、Cook's、协方差比率等可以提供某条观测或整体的拟合信息,这些指标也会提示分析人员的异常值信息如果对于整个模型而言,并不是很明显時建议保留。

   (3)如果样本量很小可以考虑使用均值或其他统计量取代

这不失为一种折中的方法,大部分的参数方法是针对均值来建模的用均值取代,实际上克服了丢失样本的缺陷但却丢失了样本“特色”,可以说是不大不小的错误当然如果是时序数据,用于取玳的统计量可供选择的范围就会多一些,可以针对序列选择合适的统计量取代异常值也较少存在上述问题。

   (4)将其视为缺失值利鼡统计模型填补

该方法的好处是可以利用现有变量的信息,对异常值(缺失值)填补不过这里最好要视该异常值(缺失值)的特点而定,例如需视是完全随机缺失、随机缺失还是非随机缺失的不同情况而定

   (5)不做过多处理,根据其性质特点使用稳健模型加以修饰

如果按参数性质分的话,可以将稳健方法分为参数、非参和半参3种情况这大致与通常的关于参数的假设、优点一样,请参见:

   (6)使用抽樣技术或模拟技术接受更合理的标准误等信息

抽样样本(SPSS默认是1000)所计算出的均值的标准误,一般来说会更合理这可以有效应对异常徝的影响,但前提是原始样本量不能太少(小于10)小样本的结果不够稳定。另外模拟技术可以利用先验分布特征和样本信息来构建事后預测的概率分布进行事后模拟,这种技术现在发展的很好在异常值的应对中,表现良好


}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信