統計学におけるモーメント:確率分布の特徴を表す指標

統計学におけるモーメント (Moment) とは、確率分布の形状を特徴づける量であり、物理学におけるモーメント(回転力)の概念を統計学に応用したものです。確率変数 $X$ の分布がどのような形をしているか、その中心、広がり、非対称性、尖り具合などを定量的に表現するために用いられます。

モーメントの定義

確率変数 $X$ の確率密度関数(または確率質量関数)を $f(x)$ とするとき、原点周りの $n$ 次モーメント $\mu’_n$ は以下のように定義されます。

$$ \mu’n = \mathbb{E}[X^n] = \int{-\infty}^{\infty} x^n f(x) dx $$

また、平均 $\mu = \mathbb{E}[X]$ 周りの $n$ 次モーメント(中心モーメント) $\mu_n$ は以下のように定義されます。

$$ \mu_n = \mathbb{E}[(X - \mu)^n] = \int_{-\infty}^{\infty} (x - \mu)^n f(x) dx $$

低次モーメントの意味

0次モーメント

  • 原点周りの0次モーメント: $\mu’0 = \int{-\infty}^{\infty} x^0 f(x) dx = \int_{-\infty}^{\infty} f(x) dx = 1$ これは、確率密度関数の全区間での積分が1になるという確率の基本性質を表します。

1次モーメント

  • 原点周りの1次モーメント: $\mu’1 = \int{-\infty}^{\infty} x^1 f(x) dx = \mathbb{E}[X] = \mu$ これは、確率変数の**平均値(期待値)**を表します。分布の中心の位置を示します。

2次モーメント

  • 中心2次モーメント: $\mu_2 = \mathbb{E}[(X - \mu)^2] = \sigma^2$ これは、確率変数の分散 (Variance) を表します。分布の広がり具合を示します。

高次モーメントの意味

3次モーメント(歪度)

中心3次モーメント $\mu_3$ を用いて、分布の歪度 (Skewness) $\gamma_1$ が定義されます。

$$ \gamma_1 = \frac{\mu_3}{\sigma^3} $$

歪度は、分布の非対称性を示します。

  • $\gamma_1 > 0$: 分布が右に裾を引く(右に歪んでいる)
  • $\gamma_1 < 0$: 分布が左に裾を引く(左に歪んでいる)
  • $\gamma_1 = 0$: 分布が左右対称(正規分布など)

4次モーメント(尖度)

中心4次モーメント $\mu_4$ を用いて、分布の尖度 (Kurtosis) $\gamma_2$ が定義されます。

$$ \gamma_2 = \frac{\mu_4}{\sigma^4} - 3 $$

尖度は、分布の尖り具合や裾の重さを示します。正規分布の尖度が3であるため、通常はそこから3を引いた値が用いられます(超過尖度)。

  • $\gamma_2 > 0$: 分布が正規分布よりも尖っており、裾が重い(データが中心に集中し、外れ値が多い)
  • $\gamma_2 < 0$: 分布が正規分布よりも平坦で、裾が軽い
  • $\gamma_2 = 0$: 分布が正規分布と同じ尖り具合

モーメントは、確率分布の様々な特性を捉えるための基本的なツールであり、データ分析や機械学習において、データの性質を理解するために重要な役割を果たします。