P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。由R·A·Fisher提出。
P值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的机率。如果P值很小,说明原假设情况的发生的机率很小,而如果出现了,根据小机率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。,P值越小,表明结果越显着。检验的结果究竟是“显着的”、“中度显着的”还是“高度显着的”需要我们自己根据P值的大小和实际问题来解决。
基本介绍
- 中文名P值
- 外文名P value
- 计算方法3种情况
- 作用用来判定假设检验结果的一个参数
- 创立者R·A·Fisher
- 时间1890-1962
定义
p值是指在一个机率模型中,统计摘要(如两组样本均值差)与实际观测数据相同,或甚至更大这一事件发生的机率。换言之,是检验假设零假设成立或表现更严重的可能性。p值若与选定显着性水平(0.05或0.01)相比更小,则零假设会被否定而不可接受。这并不直接表明原假设正确。p值是一个服从常态分配的随机变数,在实际使用中因样本等各种因素存在不确定性。产生的结果可能会带来争议。
意义
发展史
R·A·Fisher(1890-1962)作为一代假设检验理论的创立者,在假设检验中提出P值的概念。他认为假设检验是一种程式,研究人员依照这一程式可以对某一总体参数形成一种判断。也就是说,他认为假设检验是数据分析的一种形式,是人们在研究中加入的主观信息。(当时这一观点遭到了Neyman-Pearson的反对,他们认为假设检验是一种方法,决策者在不确定的条件下进行运作,利用这一方法可以在两种可能中作出明确的选择,而又要控制错误发生的机率。这两种方法进行长期且痛苦的论战。虽然Fisher的这一观点同样也遭到了现代统计学家的反对,他对现代假设检验的发展作出了巨大的贡献。)
Fisher的具体做法是
假定某一参数的取值。
选择一个检验统计量(例如z 统计量或Z 统计量) ,该统计量的分布在假定的参数取值为真时应该是完全已知的。
从研究总体中抽取一个随机样本计算检验统计量的值计算机率P值或者说观测的显着水平,即在假设为真时的前提下,检验统计量大于或等于实际观测值的机率。
如果P<0.01,说明是较强的判定结果,拒绝假定的参数取值。
如果0.01<P值<0.05,说明较弱的判定结果,拒绝假定的参数取值。
如果P值>0.05,说明结果更倾向于接受假定的参数取值。
可是,那个年代,由于硬体的问题,计算P值并非易事,人们就採用了统计量检验方法,也就是我们最初学的t值和t临界值比较的方法。统计检验法是在检验之前确定显着性水平α,也就是说事先确定了拒绝域。,如果选中相同的,所有检验结论的可靠性都一样,无法给出观测数据与原假设之间不一致程度的精确度量。只要统计量落在拒绝域,假设的结果都是一样,即结果显着。但实际上,统计量落在拒绝域不同的地方,实际上的显着性有较大的差异。
,随着计算机的发展,P值的计算不再是个难题,使得P值变成最常用的统计指标之一。
计算方法
为理解P值的计算过程,用Z表示检验的统计量,ZC表示根据样本数据计算得到的检验统计量值。
左侧检验
P值是当时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的机率,即p值
右侧检验
P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的机率,即p值
双侧检验
P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的机率,即p值