偏度系数和峰度系数——三/四阶中心矩

偏度系数和峰度系数——三/四阶中心矩是指一组数据的第三阶矩与均值的立方之差 用于衡量数据的偏斜程度

大家好,欢迎来到IT知识分享网。

三阶中心矩

偏度系数(skewness)

  • 偏度定义中包括:
    正态分布(偏度=0)、
    右偏(尾巴右偏)分布(也叫正偏分布,偏度>0),
    左偏(尾巴左偏)分布(也叫负偏分布,其偏度<0)。


在这里插入图片描述

纠误★

实际上,
分布在众数两边的对称偏斜性对偏度值的影响是比较有限的,对偏度值影响较大的倒是分布在其中一个方向上的尾部有拉长趋势的程度。
因此,正( 负) 偏度往往更多反映的是分布在右( 左) 方向的尾部比在左( 右) 方向的尾部有拉长的趋势。

峰度系数(kurtosis)

峰度(peakedness;kurtosis)又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了峰部的尖度 。样本的峰度是和正态分布相比较而言统计量,如果峰度大于三,峰的形状比较尖,比正态分布峰要陡峭。反之亦然。——来自百度百科
峰度系数 = (四阶中心矩 / 方差的平方)- 3
所以取值范围是[-3, +∞)
随机变量X 的峰度,度量了分布尾部相对于正态分布而言的重轻(厚薄).
若 > 0,则说明X 的分布的尾部比正态分布的尾部重;
若 < 0,则说明X 的尾部比正态分布轻.




峰度常被学生理解为是描述一个分布相对于正态分布陡峭程度的量.事实上,这种理解是不正确的
图2

https://youtu.be/TM033GCU-SY

Key Insights 关键见解

  • 📈 Kurtosis was traditionally defined as the “peakedness” of a distribution, but recent research shows that it is more about the thickness of the tails and the presence of outliers.
  • 📈 峰度传统上被定义为分布的“峰值”,但最近的研究表明,它更多地与尾部的厚度和异常值的存在有关。
    This challenges the common understanding of kurtosis.
  • 📊 The calculation of kurtosis involves the fourth standardized moment, which measures the difference from the mean to the power of four, divided by the standard deviation to the power of four.
    这挑战了对峰度的普遍理解。
  • 📊 峰度的计算涉及第四个标准化矩,它测量从平均值到四的幂的差,除以标准差到四的幂。
    Adjustments are made for sample data.
  • 📉 Kurtosis ranges from 1 to infinity, with a normal distribution having a kurtosis of 3. Distributions with higher kurtosis have thicker tails and potentially more outliers, while distributions with lower kurtosis have flatter peaks and shorter tails.
  • ❗️ The controversy surrounding kurtosis arises from the misconception that peakedness directly affects kurtosis.
    对样本数据进行调整。
  • 📉 峰度范围从 1 到无穷大,峰度为 3 的正态分布。峰度较高的分布具有较厚的尾部和可能更多的异常值,而峰度较低的分布具有更平坦的峰值和较短的尾部。
  • ❗️ 围绕峰度的争议源于峰值直接影响峰度的误解。
    In reality, the presence of outliers and the thickness of the tails play a more significant role in determining kurtosis.
  • 📐 While the calculation of kurtosis can provide information about the distribution, it is important to understand that it does not solely indicate peakedness.
    实际上,异常值的存在和尾巴的厚度在确定峰度方面起着更重要的作用。
  • 📐 虽然峰度的计算可以提供有关分布的信息,但重要的是要了解它并不仅仅表示峰值。
    The idea of peakedness is more related to the common characteristics of distributions rather than the calculation of kurtosis itself.
    峰值的概念更多地与分布的共同特征有关,而不是峰度本身的计算。

总结

调用

纠误

Skewness and Kurtosis : the two summary stats they never taught you

概要

亮点

📈 平均值
只能提供有限的信息,标准差、偏度和峰度可以提供更全面的数据分布情况。
标准差帮助我们了解数据的离散程度,偏度和峰度帮助我们了解分布的偏斜和尾部异常情况。
📊 标准差
标准差可以告诉我们数据的离散程度,帮助我们了解平均值的不确定性。
📈 偏度
偏度可以告诉我们分布的偏斜程度,即数据分布的不对称性。
📉 峰度
峰度可以告诉我们分布的尾部厚度,即数据分布的尾部异常情况。







参考文献

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/132855.html

(0)
上一篇 2025-07-28 15:00
下一篇 2025-07-28 15:10

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信