カイ二乗分布

カイ二乗分布
確率密度関数
Probability density plots of gamma distributions
累積分布関数
Cumulative distribution plots of gamma distributions
母数 k N {\displaystyle k\in \mathbb {N} }
[0, ∞)
確率密度関数 x k / 2 1 e x / 2 2 k / 2 Γ ( k / 2 ) {\displaystyle {\frac {x^{k/2-1}e^{-x/2}}{\,2^{k/2}\Gamma (k/2)}}}
累積分布関数 γ ( k / 2 , x / 2 ) Γ ( k / 2 ) {\displaystyle {\frac {\gamma (k/2,x/2)}{\Gamma (k/2)}}}
期待値 k
中央値 k 2 3 + 4 27 k 8 729 k 2 {\displaystyle \simeq k-{\frac {2}{3}}+{\frac {4}{27k}}-{\frac {8}{729k^{2}}}}
最頻値 0 for k < 2
k − 2 for k ≥ 2
分散 2k
歪度 2 2 k {\displaystyle {\frac {2{\sqrt {2}}}{\sqrt {k}}}}
尖度 12/k
エントロピー k/2 + ln 2 + ln Γ(k/2)
+ (1 − k/2)ψ(k/2)
モーメント母関数 1 ( 1 2 t ) k / 2  for  t < 1 / 2 {\displaystyle {\frac {1}{(1-2t)^{k/2}}}{\text{ for }}t<1/2}
特性関数 1 ( 1 2 i t ) k / 2 {\displaystyle {\frac {1}{(1-2it)^{k/2}}}}
テンプレートを表示

カイ二乗分布(カイにじょうぶんぷ、カイじじょうぶんぷ)、またはχ2分布確率分布の一種で、推計統計学で最も広く利用されるものである。ヘルメルトにより発見され[1]ピアソンにより命名された[2]

独立に標準正規分布に従う k 個の確率変数 X1, …, Xk をとる。このとき、統計量

Z = i = 1 k X i 2 {\displaystyle Z=\sum _{i=1}^{k}{X_{i}}^{2}}

の従う分布のことを自由度 k のカイ二乗分布と呼ぶ。

普通はこれを

Z χ k 2 {\displaystyle Z\sim \chi _{k}^{2}}

と書く。カイ二乗分布は k という1個の母数をもつ。これは Xi自由度に等しい正の整数である(場合によっては非整数自由度のカイ二乗分布も用いられる)。カイ二乗分布はガンマ分布の特殊な場合に当たる。

カイ二乗分布はカイ二乗検定と総称される多くの検定法のほか、フリードマン検定(英語版)などにも利用される。

性質

カイ二乗分布の確率密度関数x ≥ 0 に対し

f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) x k / 2 1 e x / 2 {\displaystyle f(x;k)={\frac {1}{2^{k/2}\Gamma (k/2)}}x^{k/2-1}e^{-x/2}}

また x ≤ 0 に対し fk(x) = 0 という形をとる。ここで Γガンマ関数である。

分布関数

F ( x ; k ) = γ ( k / 2 , x / 2 ) Γ ( k / 2 ) {\displaystyle F(x;k)={\frac {\gamma (k/2,x/2)}{\Gamma (k/2)}}}

(ただし γ(k, z)不完全ガンマ関数)である。

Y = X 1 / ν 1 X 2 / ν 2 {\displaystyle Y={\frac {X_{1}/\nu _{1}}{X_{2}/\nu _{2}}}} (ただし X 1 χ ν 1 2 {\displaystyle X_{1}\sim \chi _{\nu _{1}}^{2}} X 2 χ ν 2 2 {\displaystyle X_{2}\sim \chi _{\nu _{2}}^{2}} はカイ二乗分布に従う独立な確率変数)とすると、 Y F ( ν 1 , ν 2 ) {\displaystyle Y\sim \mathrm {F} (\nu _{1},\nu _{2})} 、つまり自由度で割って比をとるとF分布に従う。

X χ 2 2 {\displaystyle X\sim \chi _{2}^{2}} (自由度2)ならば、X は期待値 2指数分布に従う。

自由度 k のカイ二乗分布に従う確率変数の期待値k で、分散は 2k である。中央値は近似的に

k 2 3 + 4 27 k 8 729 k 2 {\displaystyle k-{\frac {2}{3}}+{\frac {4}{27k}}-{\frac {8}{729k^{2}}}}

となる。

カイ二乗分布は再生性を持つ。すなわち、 X χ m 2 ,   Y χ n 2 {\displaystyle X\sim \chi _{m}^{2},\ Y\sim \chi _{n}^{2}} ならば、 X + Y χ m + n 2 {\displaystyle X+Y\sim \chi _{m+n}^{2}} となる。

正規分布による近似

X χ k 2 {\displaystyle X\sim \chi _{k}^{2}} として、k が無限大に近づくと X の分布は正規分布に近づくが、近づき方はゆっくりしている(歪度 8 k {\displaystyle {\sqrt {\frac {8}{k}}}} 尖度 12/k)ため、X 自体より速く正規分布に近づく次の2つの方法が普通用いられる。

  • 2 X {\displaystyle {\sqrt {2X}}} は近似的に平均 2k − 1、分散 1 の正規分布に従う(ロナルド・フィッシャー)。
  • X k 3 {\displaystyle {\sqrt[{3}]{\frac {X}{k}}}} は近似的に平均 1 − 2/9k、分散 2/9k の正規分布に従う(ウィルソンとヒルファティ、1931年)。

出典

  1. ^ Helmert, F. R. (1875): Ueber die Berechnung des wahrscheinlichen Fehlers aus einer endlichen Anzahl wahrer Beobachtungsfehler, Zeitschrift für Mathematik und Physik, 20, 300-303, インターネットアーカイブ: zeitschriftfrma29runggoog/page/n287.
  2. ^ Pearson, K. (1900): On the Criterion that a Given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it Can Reasonably Be Supposed to have Arisen from Random Sampling, Philosophical Magazine 5, 50, 157-175, doi:10.1080/14786440009463897.

関連項目

離散単変量で
有限台
離散単変量で
無限台
  • ベータ負二項(英語版)
  • ボレル(英語版)
  • コンウェイ–マクスウェル–ポワソン(英語版)
  • 離散位相型(英語版)
  • ドラポルト(英語版)
  • 拡張負二項(英語版)
  • ガウス–クズミン
  • 幾何
  • 対数(英語版)
  • 負の二項
  • 放物フラクタル(英語版)
  • ポワソン
  • スケラム(英語版)
  • ユール–サイモン(英語版)
  • ゼータ(英語版)
連続単変量で
有界区間に台を持つ
  • 逆正弦(英語版)
  • ARGUS(英語版)
  • バルディング–ニコルス(英語版)
  • ベイツ(英語版)
  • ベータ
  • beta rectangular(英語版)
  • アーウィン–ホール(英語版)
  • クマラスワミー(英語版)
  • ロジット-正規(英語版)
  • 非中心ベータ(英語版)
  • raised cosine(英語版)
  • reciprocal(英語版)
  • 三角
  • U-quadratic(英語版)
  • 一様
  • ウィグナー半円
連続単変量で
半無限区間に台を持つ
  • ベニーニ(英語版)
  • ベンクタンダー第一種(英語版)
  • ベンクタンダー第二種(英語版)
  • 第2種ベータ
  • Burr(英語版)
  • カイ二乗
  • カイ(英語版)
  • Dagum(英語版)
  • デービス(英語版)
  • 指数-対数(英語版)
  • アーラン
  • 指数
  • F
  • folded normal(英語版)
  • Flory–Schulz(英語版)
  • フレシェ
  • ガンマ
  • gamma/Gompertz(英語版)
  • 一般逆ガウス(英語版)
  • Gompertz(英語版)
  • half-logistic(英語版)
  • half-normal(英語版)
  • Hotelling's T-squared(英語版)
  • 超アーラン(英語版)
  • 超指数(英語版)
  • hypoexponential(英語版)
  • 逆カイ二乗(英語版)
    • scaled inverse chi-squared(英語版)
  • 逆ガウス
  • 逆ガンマ
  • コルモゴロフ
  • レヴィ
  • 対数コーシー
  • 対数ラプラス(英語版)
  • 対数ロジスティック(英語版)
  • 対数正規
  • ロマックス(英語版)
  • 行列指数(英語版)
  • マクスウェル–ボルツマン
  • マクスウェル–ユットナー(英語版)
  • ミッタク-レフラー(英語版)
  • 仲上(英語版)
  • 非心カイ二乗
  • パレート
  • 位相型(英語版)
  • poly-Weibull(英語版)
  • レイリー
  • relativistic Breit–Wigner(英語版)
  • ライス(英語版)
  • shifted Gompertz(英語版)
  • 切断正規
  • タイプ2ガンベル(英語版)
  • ワイブル
    • 離散ワイブル(英語版)
  • ウィルクスのラムダ(英語版)
連続単変量で
実数直線全体に台を持つ
連続単変量で
タイプの変わる台を持つ
  • 一般極値
  • 一般パレート(英語版)
  • マルチェンコ–パストゥール(英語版)
  • q-指数(英語版)
  • q-ガウス
  • q-ワイブル(英語版)
  • shifted log-logistic(英語版)
  • トゥーキーのラムダ(英語版)
混連続-離散単変量
  • rectified Gaussian(英語版)
多変量 (結合)
【離散】
エウェンズ(英語版)
多項
ディリクレ多項(英語版)
負多項(英語版)
【連続】
ディリクレ
一般ディリクレ(英語版)
多変量正規
多変量安定(英語版)
多変量 t(英語版)
正規逆ガンマ(英語版)
正規ガンマ(英語版)
行列値
逆行列ガンマ(英語版)
逆ウィッシャート(英語版)
行列正規(英語版)
行列 t(英語版)
行列ガンマ(英語版)
正規逆ウィッシャート(英語版)
正規ウィッシャート(英語版)
ウィッシャート
方向
【単変量 (円周) 方向
円周一様(英語版)
単変数フォン・ミーゼス
wrapped 正規(英語版)
wrapped コーシー(英語版)
wrapped 指数(英語版)
wrapped 非対称ラプラス(英語版)
wrapped レヴィ(英語版)
【二変量 (球面)】
ケント(英語版)
【二変量 (トロイダル)】
二変数フォン・ミーゼス(英語版)
【多変量】
フォン・ミーゼス–フィッシャー(英語版)
ビンガム(英語版)
退化特異
  • 円周(英語版)
  • 混合ポワソン(英語版)
  • 楕円(英語版)
  • 指数
  • 自然指数(英語版)
  • 位置尺度(英語版)
  • 最大エントロピー(英語版)
  • 混合(英語版)
  • ピアソン(英語版)
  • トウィーディ(英語版)
  • wrapped(英語版)
サンプリング法(英語版)
  • 一覧記事 一覧(英語版)
  • カテゴリ カテゴリ