一开始, p 值背后的理论和原假设可能看起来很复杂,但是了解这些概念将有助于您浏览统计领域。 不幸的是,这些术语在流行科学中经常被滥用,因此对每个人了解基本知识都将是有用的。
另请参阅我们的文章如何在Excel中删除其他所有行
使用MS Excel,计算模型的 p 值和证明/证明原假设非常简单。 有两种方法可以做到,我们将同时介绍这两种方法。 让我们深入。
零假设和 p 值
零假设是一种陈述,也称为默认位置,该陈述声称观察到的现象之间的关系不存在。 它也可以应用于两个观察到的组之间的关联。 在研究过程中,您将检验该假设并尝试反证。
例如,假设您想观察某种时尚饮食是否有明显效果。 在这种情况下,零假设是在节食前后,受测者的体重没有显着差异。 另一种假设是饮食确实有所作为。 这就是研究人员试图证明的。
p 值表示当某个统计模型的原假设为真时,统计摘要等于或大于观察值的机会。 尽管通常将其表示为十进制数,但通常最好将其表示为百分比。 例如, p 值0.1应该表示为10%。
p 值低意味着反对原假设的证据很强。 这进一步意味着您的数据非常重要。 另一方面,高 p 值意味着没有强有力的证据反对该假设。 为了证明时尚饮食有效,研究人员需要找到一个低 p 值。
如果无效假设为真,则具有统计学意义的结果是极不可能发生的结果。 显着性水平用希腊字母alpha表示,并且必须大于 p 值,结果才具有统计显着性。
许多领域的研究人员都使用 p 值来更好,更深入地了解正在使用的数据。 一些突出的领域包括社会学,刑事司法,心理学,金融和经济学。
在Excel中查找 p 值
您可以通过T-Test函数或使用数据分析工具在MS Excel中找到数据集的 p 值。 首先,我们将研究T测试功能。 我们将检查五名接受30天饮食的大学生。 我们将比较他们在饮食前后的体重。
注意:出于本文的目的,我们将使用MS Excel2010。尽管它不是最新版本,但这些步骤通常也应适用于较新的版本。
T检验功能
请按照以下步骤使用T-Test函数计算 p 值。
- 创建并填充表。 我们的表如下所示:
- 单击表外的任何单元格。
- 输入:= T.Test(。
- 在方括号之后,键入第一个参数。 在此示例中,它是“节食前”列。 范围应为B2:B6。 到目前为止,该函数如下所示:T.Test(B2:B6。
- 接下来,我们将输入第二个参数。 After Diet栏及其结果是我们的第二个论点,我们需要的范围是C2:C6。 让我们将其添加到公式中:T.Test(B2:B6,C2:C6。
- 在第二个参数后面输入逗号,单尾分布和两尾分布选项将自动出现在下拉菜单中。 让我们选择第一个-单尾分布。 双击它。
- 输入另一个逗号。
- 在下一个下拉菜单中双击“配对”选项。
- 现在您已经拥有了所需的所有元素,请关闭括号。 此示例的公式如下所示:= T.Test(B2:B6,C2:C6, 1, 1)
- 按Enter键。 单元格将立即显示 p 值。 在我们的情况下,值为0.133906或13.3906%。
高于5%时,此 p 值无法提供针对原假设的有力证据。 在我们的例子中,研究没有证明节食可以帮助测试对象减轻体重。 这并不一定意味着原假设是正确的,只是尚未被证实。
数据分析路线
数据分析工具使您可以做很多很酷的事情,包括 p 值计算。 为简化起见,我们将使用与先前方法相同的表。
这是完成的过程。
- 由于我们已经在D列中获得了重量差异,因此我们将跳过差异计算。 对于将来的表,请使用以下公式:=“单元1”-“单元2”。
- 接下来,在主菜单中单击数据选项卡。
- 选择数据分析工具。
- 向下滚动列表,然后单击“ t检验:均值配对两个样本”选项。
- 单击确定。
- 将会出现一个弹出窗口。 看起来像这样:
- 输入第一个范围/参数。 在我们的示例中,它是B2:B6。
- 输入第二个范围/参数。 在这种情况下,它是C2:C6。
- 将默认值保留在Alpha文本框中(为0.05)。
- 单击输出范围单选按钮,然后选择想要的结果。 如果是A8单元格,则键入:$ A $ 8。
- 单击确定。
- Excel将计算 p 值和其他几个参数。 决赛桌可能看起来像这样:
如您所见,单尾 p 值与第一种情况相同-0.133905569。 由于它高于0.05,因此原假设适用于此表,而针对它的证据很薄弱。
关于 p 值的注意事项
以下是有关Excel中 p 值计算的一些有用提示。
- 如果 p 值等于0.05(5%),则表中的数据很重要。 如果小于0.05(5%),则您拥有的数据非常重要。
- 如果 p 值大于0.1(10%),则表中的数据不重要。 如果它在0.05-0.10范围内,则您具有重要的数据。
- 您可以更改Alpha值,尽管最常见的选项是0.05(5%)和0.10(10%)。
- 根据您的假设,选择双尾检验可能是更好的选择。 在上面的示例中,单尾测试意味着我们探索被测者节食后是否减肥,而这正是我们需要找出的。 但是,两尾检验也将检查它们是否获得了统计学上显着的体重。
- p 值无法识别变量。 换句话说,如果它确定了相关性,就无法确定其背后的原因。
p 值已神秘化
每个值得他或她精打细算的统计学家都必须了解原假设检验的来龙去脉以及 p 值的含义。 这些知识也将在许多其他领域的研究人员中派上用场。
您是否曾经使用Excel计算统计模型的 p 值? 您使用哪种方法? 您是否喜欢另一种计算方式? 请在评价部分留下您的意见。
