P 值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。由 R·A·Fisher 首先提出。
P 值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果 P 值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P 值越小,我们拒绝原假设的理由越充分。总之,P 值越小,表明结果越显著。但是检验的结果究竟是“显著的”“中度显著的”还是“高度显著的”需要我们自己根据 P 值的大小和实际问题来解决。
定义 p 值是指在一个概率模型中,统计摘要(如两组样本均值差)与实际观测数据相同,或甚至更大这一事件发生的概率。换言之,是检验假设零假设成立或表现更严重的可能性。p 值若与选定显著性水平(0.05 或 0.01)相比更小,则零假设会被否定而不可接受。然而这并不直接表明原假设正确。p 值是一个服从正态分布的随机变量,在实际使用中因样本等各种因素存在不确定性。产生的结果可能会带来争议。
例如,某披萨店声称他们的平均配送时间小于等于 30 分钟,你可以通过假设检验来验证这一说法。零假设为平均配送时间小于等于 30 分钟,备择假设为平均配送时间大于 30 分钟。然后,对配送时间进行随机采样,并计算每个数据点的 Z 分数。Z 分数可以告诉我们数据点相对于总体平均值的位置。最后,根据实验开始前设定的显著水平(alpha)检验结果是否具有统计学意义。如果 P 值小于显著水平,则拒绝零假设,接受备择假设,即平均配送时间大于 30 分钟。