統計学におけるモーメント (Moment) とは、確率分布の形状を特徴づける量であり、物理学におけるモーメント(回転力)の概念を統計学に応用したものです。確率変数 $X$ の分布がどのような形をしているか、その中心、広がり、非対称性、尖り具合などを定量的に表現するために用いられます。
モーメントの定義
確率変数 $X$ の確率密度関数(または確率質量関数)を $f(x)$ とするとき、原点周りの $n$ 次モーメント $\mu’_n$ は以下のように定義されます。
$$ \mu’n = \mathbb{E}[X^n] = \int{-\infty}^{\infty} x^n f(x) dx $$
また、平均 $\mu = \mathbb{E}[X]$ 周りの $n$ 次モーメント(中心モーメント) $\mu_n$ は以下のように定義されます。
$$ \mu_n = \mathbb{E}[(X - \mu)^n] = \int_{-\infty}^{\infty} (x - \mu)^n f(x) dx $$
低次モーメントの意味
0次モーメント
- 原点周りの0次モーメント: $\mu’0 = \int{-\infty}^{\infty} x^0 f(x) dx = \int_{-\infty}^{\infty} f(x) dx = 1$ これは、確率密度関数の全区間での積分が1になるという確率の基本性質を表します。
1次モーメント
- 原点周りの1次モーメント: $\mu’1 = \int{-\infty}^{\infty} x^1 f(x) dx = \mathbb{E}[X] = \mu$ これは、確率変数の**平均値(期待値)**を表します。分布の中心の位置を示します。
2次モーメント
- 中心2次モーメント: $\mu_2 = \mathbb{E}[(X - \mu)^2] = \sigma^2$ これは、確率変数の分散 (Variance) を表します。分布の広がり具合を示します。
高次モーメントの意味
3次モーメント(歪度)
中心3次モーメント $\mu_3$ を用いて、分布の歪度 (Skewness) $\gamma_1$ が定義されます。
$$ \gamma_1 = \frac{\mu_3}{\sigma^3} $$
歪度は、分布の非対称性を示します。
- $\gamma_1 > 0$: 分布が右に裾を引く(右に歪んでいる)
- $\gamma_1 < 0$: 分布が左に裾を引く(左に歪んでいる)
- $\gamma_1 = 0$: 分布が左右対称(正規分布など)
4次モーメント(尖度)
中心4次モーメント $\mu_4$ を用いて、分布の尖度 (Kurtosis) $\gamma_2$ が定義されます。
$$ \gamma_2 = \frac{\mu_4}{\sigma^4} - 3 $$
尖度は、分布の尖り具合や裾の重さを示します。正規分布の尖度が3であるため、通常はそこから3を引いた値が用いられます(超過尖度)。
- $\gamma_2 > 0$: 分布が正規分布よりも尖っており、裾が重い(データが中心に集中し、外れ値が多い)
- $\gamma_2 < 0$: 分布が正規分布よりも平坦で、裾が軽い
- $\gamma_2 = 0$: 分布が正規分布と同じ尖り具合
モーメントは、確率分布の様々な特性を捉えるための基本的なツールであり、データ分析や機械学習において、データの性質を理解するために重要な役割を果たします。