为什么统计学中常用的指标有哪些1%、5%、10%显著？

点击联系发帖人 时间：2024-05-05 11:45

统计学中常用的指标有哪些

摘要在公司金融领域，报告研究结果的经济显著性越来越普遍了，但相关文献综述也揭示了一些典型报告实践中的不足。研究者可以采用如下方式更有效地传达研究结果的重要性：使用经过标准差调整的因变量的经济显著性指标，通过提供所有必要的用于计算经济显著性的统计数据，提供评估经济显著性的基准。为了达到这些目标，我展示了为什么用经过标准差调整的衡量指标更可取，同时我也依据文献提供了基准。值得注意的是，作者 Mittion 的这篇论文和另一篇介绍统计显著性的论文（Mitton, 2022) 可以称得上是姊妹篇，有兴趣的朋友也可以参考（译者注）。 Mitton T., 2022, Methodological Variation in Empirical Corporate Finance, The Review of Financial Studies, 35(2): 527-575.0. 编者按下面这幅颇具视觉冲击力的漫画源自 Amrhein et al. (2019) 发表于 Nature 的论文。论文的标题旗帜鲜明： Scientists rise up against statistical significance (科学家们反对统计显著性！)Amrhein, V., S. Greenland, B. McShane, 2019, Scientists rise up against statistical significance, Nature, 567: 305-307.事实上，类似的争论已经持续了多年。摆在大家面前的有两条路：其一，放弃 p 值，寻求更好的统计指标和推断方法；其二，仍然使用 p 值，但要谨慎，不要过度甚至错误解读。现在看来，第一种方案的面临诸多阻力。一方面，大家在指责 p 值不好的同时，似乎也给不出令多数人信服的替代方案；另一方面，惯性使然，无论是教科书还是期刊文献，抑或统计和计量软件，想要转用一套新标准，并非易事。第二种方案属于改良派思想，易于接受。今天要介绍的这篇论文便是按此路径尝试的一篇佳作。作者给出了一些颇具实操性的建议，尤其是强调「经济显著性」这一概念，这往往是追求 p 值的论文中现有讨论，甚至被完全忽略的问题。举个简单的例子：假设我们评估一项扶贫政策，利用多种复杂的计量模型估计出的结果都表明政策效果很显著。然而，当我们仔细分析系数的经济含义时，却吃惊地发现：政府补贴每年农户 1000 元，可以使其家庭可支配收入在 1% 水平上显著增加 0.05 元。这个颇具学术范儿的「建言」会被采纳吗？1. 引言近年来，各个学科的学者们反思，甚至质疑实证结果中统计显著性。在公司金融的实证研究中，研究者除了要解释结果的统计显著性，也要对结果的经济显著性进行阐释，而且这种做法越来越常见。本文已有文献中对结果经济显著性解释的做法，目的是找到可行简单的改进方法，以增加对公司金融实证研究结果经济显著性的理解。在公司金融实证论文中，一个评估经济显著性的标准框架是：根据估计的回归系数，报告被解释变量随解释变量变动而产生的变动。Ghaly et al. (2017)的例子: 雇佣更高比例的熟练劳动力（用 LSI 指数衡量）的公司持有更多的预防性现金，其经济显著性解释为：LSI 指数增加一个标准差，现金-资产比率增加 4.2%，这相当于样本平均值的现金-资产比率增加了 21.2%。然而，本文针对阻碍经济显著性的有效评估，提出了三个主要挑战。挑战 1：对经济显著性的衡量缺乏理想的特性在我们对文献考察的样本中，超过 56%的文献是用因变量的变化除以样本均值。这会存在五个问题。第一，虽然经过平均值调整的测量指标对数据的乘法变换具有稳健性，但它们可以通过因变量的加法转换而被夸大，比如行业调整。第二，经过平均值调整的衡量指标往往对不相关的自变量产生经济显著性的过高估计。第三，经过平均值调整的衡量指标较为敏感，研究者可以通过一些方法的组合得到对经济显著性的高估计。第四，经过平均值调整的衡量指标易受到异常值的影响。第五，当因变量包含负值时，例如当因变量是盈利能力时，经过平均值调整的衡量指标是不稳健的。一个最简单的解决方式是，将因变量进行标准差的调整。经过标准差调整的衡量指标可以符合上述 5 个理想特性，很好地解决挑战一。尽管具有这些理想的特性，但本文的样本中只有 10%的文章使用了标准差的调整测度经济显著性。挑战 2：无法提供评估经济显著性的必要统计数据第二个挑战是，论文通常无法提供评估经济意显著性的必要统计数据。虽然对论文的经济显著性进行评估，只需要回归系数和自变量、因变量的标准差，但本文的样本中只有 33%的论文提供了上述数据。挑战 3：没有提供便于对经济显著性的衡量进行比较的基准第三个挑战是，作者通常没有提供基准来比较其经济显著性的衡量标准。当这一基准没有提供时，读者无法判断报告的效应有多大。本文提出了可以使用的两个基准。第一组基准来自于发表在 Journal of Finance (JF), Journal of Financial Economics (JFE), 以及 Review of Financial Studies (RFS) 三个顶级金融期刊上的关键结果的经济显著性。在样本中，我们进行了 954 次回归，计算了样本中所有论文中的关键解释变量的经济显著性标准度量。虽然要小心进行比较，但这一统计可以帮助研究者将他们的结果与发表在顶级期刊上的结果进行对比。附表 3-7 给出了常用的公司金融结果的影响因素的经济影响方向及大小，其中 A3 是利润率，A4 为企业价值，A5 是杠杆率，A6 是投资，A7 是支付，A8 是现金持有（具体表格，感兴趣的朋友可以在原文链接处下载后查看）。第二组基准是根据公司金融实证中通常包含的标准标制变量的经济显著性计算出来的。总的来说，本文提出了三点改进的要求。研究者应该基于标准差而不是均值去评估经济显著性，应该提供必要的用以评估经济显著性的统计数据；研究者应该提供一个评估基准。1. 目前的做法为了更好地理解当前公司金融文献中，经济显著性是如何操作的，我们对金融顶级期刊的做法进行综述。实证公司金融选取了一系列的因变量进行回归，因此我们将综述中的因变量限定为以下 6 个方面：利润率、企业价值、杠杆率、投资、支付以及现金持有。1.1 公司金融回归的样本本文收集了 Journal of Finance, Journal of Financial Economics, 以及 Review of Financial Studies 的 2000-2018 的有关利润率、企业价值、杠杆率、投资、支付以及现金持有这六个方面的研究。如表 1 所示，在这一阶段，相关研究增长很快，从 2000 年的 181 篇增长到 2018 年的 299 篇。1.2 经济显著性的指标使用尽管表达经济显著性的一般框架是类似的，但研究者们使用了多种指标评估经济显著性。他们通常是这样做的：以回归估计系数为基准，说明一定幅度的解释变量变动，导致的被解释变量变动是多少。不同论文的差异主要是两方面：一是假定的解释变量变动量不同（例如，解释变量变动一个标准差）；二是被解释变量的变动测度（例如，相对于被解释变量的均值变化的百分比）。表 2 统计了 604 篇文章中 396 篇报告了经济显著性的文献。第 (1) - (6) 行是连续型解释变量，第 (7) 行是虚拟解释变量。第 (2) 列是研究者使用的不同的解释变量变动指标，包括一个标准差变动(one-standard-deviation)、从 25%-75%的分位数变动(interquartile range, IQR)、其他分位数变动(other percentile shifts, 比如从 10%到 90%分位数)、一个百分点变动(one percentage points)以及其他类型。表上半部分的(3)-(8)列是被解释变量变动测度的不同方式，包括均值的百分比(第 3 列)、标准差的百分比(第 4 列)、百分点(第 5 列)、概率（对虚拟因变量，第 6 列）、百分比（对于对数因变量，第 7 列）。从表 2 我们也可以看到，无论是用连续型标准差还是二值虚拟变量作为解释变量的假定变动，都是用均值百分比表示因变量变动的占比较大，用标准差表示因变量的占比较小。整体上，在如何度量经济显著性方面，现有研究缺乏共识。2. 经济显著性测度的性质我们现在探讨上述定义的经济显著性指标的一些性质。我们聚焦于经过被解释变量均值调整的测度与经过被解释变量标准差调整的测度间的对比。三个性质为标尺独立 (scale independence)、来源独立(origin independence) 以及负变量的稳健性 (robustness with negative variables)，对这三个性质的讨论是基于理论分析，它们同样也适用于对因变量的分析。另外三个性质的讨论基于对 6 个常用因变量模拟回归的实证检验，这三个性质是不存在虚假估计(absence of spurious estimates)、反对挑选模型设定(resistance to specification searching) 以及对抗异常值 (resistance to outliers)。2.1 标尺独立标尺独立的含义是，对数据的乘法变换是否会影响经济显著性的检验结果。这一性质很重要，因为研究者可以根据研究目的调整数据的量纲或将数据放大或缩小，而这一操作应该不影响经济显著性。我们发现，对于无论是按标准差衡量，或是按均值调整的测度，对自变量 (x) 或因变量 (y) 的乘法变换都是满足标尺独立性质。2.2 来源独立来源独立的含义是，它们是否通过基础数据的加性转换而保持不变。这一特性很重要，因为在公司金融的实证研究中，研究者有时会在基础数据中添加或减去常数（例如，当变量经过行业调整时），但这一变换不应该影响经济显著性。我发现，因变量按标准偏差的度量结果，其经济显著性在经过 x 或 y 的加性变换后保持不变。但是按平均值调整的测度不满足来源独立的性质。具体而言，当在因变量中加入一个正的常数时，经济显著性的测度会降低；当在因变量中减去正的常数时，经济显著性的测度会被夸大。2.3 不存在虚假估计接下来，我检验各种测度是否会对经济显著性产生虚假的较大估计。本文通过随机生成的数据，将随机生成的自变量对常见的因变量进行回归，并计算其经济显著性。理想的情况是，由于自变量是随机生成的，因此其经济显著性可以忽略，或非常接近于 0 。同时，本文还使用样本选择、变量转换和模型设定等替代方法来回归，以评估具体的方法选择对经济显著性所产生的影响。2.3.1 变量和描述性统计用于模拟的数据集来自 Compustat, 包括 1963-2018 年间的 40 万个企业-年份观测值。在我们的样本中，77% 的论文使用了这一数据集，因此具有代表性。在进行模拟时，有两个重要问题。第一个重要的问题是对于被解释变量的代理变量选择，因为研究者使用了许多不同的代理变量来代表公司的盈利能力、价值、杠杆、投资、支付或现金持有。本文考察了样本中的 954 个回归，并交替使用了每种回归中最常用的两个代理变量。第二个重要的问题是对回归中控制变量的选择，我在至少 50% 的情况下使用了已有文献中的控制变量。附表 A1 是变量的定义，附表 A2 是变量的描述性统计。详细内容参见连享会推文专题：回归分析抛弃 p 值？经济显著性与统计显著性相关推文 Note：产生如下推文列表的 Stata 命令为：. lianxh p值
. songbl p值安装最新版 lianxh/ songbl 命令：. ssc install lianxh, replace. ssc install songbl, replace专题：Stata入门 25常见种误区：P值、置信区间和统计功效专题：回归分析抛弃p值？经济显著性与统计显著性}

常信村百科网