admin管理员组

文章数量:1026989

统计分析

卡方分布

卡方分布是以一种很简单的方式和正态分布产生关联:如果一个随机变量X服从标准正态分布,那么X^2服从卡方分布,其自由度是1,n个独立的标准正态随机变量的平方和有n个自由度
在这里插入图片描述

举例

一个药品制造商接到一个药品订单,需要发货的药品的标准差为0.05。从下一批次的药品开始,n=13的随机样本重量为3.04g, 2.94g, 3.01g, 3.00g, 2.94g, 2.91g, 3.02g, 3.04g, 3.09g, 2.95g, 2.99g, 3.10g, 3.02g。

问题:标准差是否高于准许值?
回到:由于卡方分布描述了来自标准正态分布的随机变数的平方和,我们不得不在计算相应的CDF值之前正态化我们的数据:

解释:如果这一批药来自标准差0.05的一个分布,那么得到一个大于或等于我们观察到的卡方值的的可能性大约是19%,所以这并不反常。换句话说,这批药符合期望的标准差。

 import numpy as npfrom scipy import statsdata = np.r_[3.04, 2.94, 3.01, 3.00, 2.94, 2.91, 3.02, 3.04, 3.09, 2.95, 2.99, 3.10, 3.02]sigma = 0.05chi2Dist = stats.chi2(len(data)-1)statistic = sum( ((data-np.mean(data)) /sigma) **2)chi2Dist.sf(statistic)

统计分析

卡方分布

卡方分布是以一种很简单的方式和正态分布产生关联:如果一个随机变量X服从标准正态分布,那么X^2服从卡方分布,其自由度是1,n个独立的标准正态随机变量的平方和有n个自由度
在这里插入图片描述

举例

一个药品制造商接到一个药品订单,需要发货的药品的标准差为0.05。从下一批次的药品开始,n=13的随机样本重量为3.04g, 2.94g, 3.01g, 3.00g, 2.94g, 2.91g, 3.02g, 3.04g, 3.09g, 2.95g, 2.99g, 3.10g, 3.02g。

问题:标准差是否高于准许值?
回到:由于卡方分布描述了来自标准正态分布的随机变数的平方和,我们不得不在计算相应的CDF值之前正态化我们的数据:

解释:如果这一批药来自标准差0.05的一个分布,那么得到一个大于或等于我们观察到的卡方值的的可能性大约是19%,所以这并不反常。换句话说,这批药符合期望的标准差。

 import numpy as npfrom scipy import statsdata = np.r_[3.04, 2.94, 3.01, 3.00, 2.94, 2.91, 3.02, 3.04, 3.09, 2.95, 2.99, 3.10, 3.02]sigma = 0.05chi2Dist = stats.chi2(len(data)-1)statistic = sum( ((data-np.mean(data)) /sigma) **2)chi2Dist.sf(statistic)

本文标签: 统计分析