统计基础
正态分布
正态分布定义
正态分布,也叫高斯分布,是概率统计领域极为重要的连续概率分布。概率密度函数公式如下:
\(f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x - \mu)^2}{2\sigma^2}}\)
公式中各个参数的含义如下:
- x:是随机变量的取值。
- μ:为正态分布的均值,也就是分布的中心位置,它决定了曲线的对称轴位置。
- σ:是正态分布的标准差,反映了数据的离散程度。σ 越大,数据越分散,曲线越扁平;σ 越小,数据越集中,曲线越陡峭。
- π:是圆周率,约等于 3.141592653589793238462643383279502664197169399375105820974944592307816406286。
- e:是自然常数,约等于 2.71828459045。
正态分布应用举例
- 生物的许多特征,如身高、体重、血压等生理指标,以及农作物的产量、果实大小等,都呈现出正态分布的特征。
- 理想气体分子的速度分布遵循麦克斯韦 - 玻尔兹曼分布,在一定条件下可近似为正态分布。
- 许多经济变量如居民收入、消费支出、股票价格的波动等,在一定程度上都近似服从正态分布。
- 产品的质量指标如零件的尺寸、重量、强度等往往服从正态分布。
- 许多生理指标如人体的体温、心率、血脂等在正常人群中服从正态分布。药物的疗效和不良反应等数据也常采用正态分布进行分析。