確率分布

確率分布(かくりつぶんぷ、: probability distribution)は、確率変数に対して、各々の値をとる確率全体を表したものである。日本産業規格では、「確率変数がある値となる確率,又はある集合に属する確率を与える関数」と定義している[1]

概要

例えば、「サイコロ2個を振ったときの出た目の和」は確率変数である。この確率変数 X に対する分布は次の表のようになる。

X の取る値 n 2 3 4 5 6 7 8 9 10 11 12
P(X の値が n を取る) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

すなわち、離散型確率変数である場合は、確率分布とは確率変数の値にその確率(確率質量)を対応させる関数(確率質量関数)のことであると言うこともできる。しかし、例えば「次に電話がなるまでの時間」といった、連続型確率変数の場合は、確率変数値での確率が全て 0 となり、確率分布を確率質量関数で表すことができない。

「次に電話がなるまでの時間」は確率変数である。この確率変数 X の分布が次のようになったとする。

X の値が取る範囲 I 1時間以内 1–2時間後 2–3時間後 3–4時間後 4時間以上先
P(XI の範囲の値を取る) 1/2 1/4 1/8 1/16 1/16

この場合の確率を全て表すには、全ての連続区間での確率を求めることになる。次の電話が a - b 時間後になる確率は次の式で表せる:

P ( a < X b ) = ( 1 2 ) a ( 1 2 ) b {\displaystyle P(a<X\leq b)=\left({\frac {1}{2}}\right)^{a}-\left({\frac {1}{2}}\right)^{b}}

累積分布関数 FX

F X ( t ) = P ( X t ) = { 1 ( 1 2 ) t , t 0 0 , t < 0 {\displaystyle F_{X}(t)=P(X\leq t)={\begin{cases}1-\left({\frac {1}{2}}\right)^{t},&t\geq 0\\0,&t<0\end{cases}}}

で定めれば、

P ( a < X b ) = F X ( b ) F X ( a ) {\displaystyle P(a<X\leq b)=F_{X}(b)-F_{X}(a)}

のように、一変数関数で分布を表現できるので便利である。さらに、FX導関数 fX確率密度関数と呼ばれ、確率は積分を用いて

P ( a < X b ) = a b f X ( t ) d t {\displaystyle P(a<X\leq b)=\int _{a}^{b}f_{X}(t)\,dt}

と書ける。

通常、連続値をとる確率変数の分布は確率密度関数を用いて記述される。なぜなら、確率密度関数は初等関数で書けるが、累積分布関数は書けない場合が多いからである。

公理主義的な確率論においては、d次元ベクトル値確率変数の確率分布とは、その確率変数の引き起こす像測度のことである。この測度は d次元ユークリッド空間上の確率測度であり、ユークリッド空間の部分集合に対して、確率変数の値がその集合に入る確率を与える関数となる。

単に確率分布というときは、d次元ユークリッド空間などのよく使われる可測空間上で定義された確率測度のことをいう。ただの確率測度と違って空間に散らばっている様子がグラフなどの目に見える形で表現できるので「分布」と呼ばれる。

確率論で、確率変数の分布を考えるのは、その変数だけを確率論的な議論の対象にしたい場合である。例えば、確率変数がある値を取る確率や、期待値、分散といった量は変数の分布が分かれば計算できる量である。逆に分布を考えることによって隠れた変数 ω[注 1] と確率変数との対応関係は失われてしまい、他の確率変数との関連性も不明になる。例えば、確率変数 XY の分布がそれぞれ PXPY のように与えられたとしても、2つの変数の関連性は分からないので、X + Y がある値を取る確率や、積 XY の期待値、X + Y の分散といった量は計算できない。このような量を計算したいときは、XY同時確率分布 PX,Y が必要となる。

よく使われる確率分布には、それぞれ名前がついており、性質がよく研究されている。このような分布をもつ確率変数に対して、研究の結果を利用することができる。例えば、確率変数の分布が平均 0、分散 1 の正規分布だった場合、その変数が 2 以上の値を取る確率は数表から 2.28% である。

定義

確率分布

  • 1次元確率分布とは可測空間 ( R , B ( R ) ) {\displaystyle (\mathbb {R} ,{\mathcal {B}}(\mathbb {R} ))} 上で定義された確率測度のことである。
  • 同様に d 次元確率分布とは ( R d , B ( R d ) ) {\displaystyle (\mathbb {R} ^{d},{\mathcal {B}}(\mathbb {R} ^{d}))} 上で定義された確率測度のことである。

なお、 B ( R d ) {\displaystyle {\mathcal {B}}(\mathbb {R} ^{d})} R d {\displaystyle \mathbb {R} ^{d}} 上のボレル集合族(集合演算で閉じた部分集合族の一種)である。

確率変数の確率分布

実数値確率変数 X の確率分布 P X : B ( R ) [ 0 , 1 ] {\displaystyle P_{X}:{\mathcal {B}}(\mathbb {R} )\to [0,1]}

P X ( A ) = P ( X A ) ,       A B ( R ) {\displaystyle P_{X}(A)=P(X\in A),\ \ \ A\in {\mathcal {B}}(\mathbb {R} )}

で定義する。PX は確率測度(像測度)である。

同様に R d {\displaystyle \mathbb {R} ^{d}} 値確率変数 X の確率分布 P X : B ( R d ) [ 0 , 1 ] {\displaystyle P_{X}:{\mathcal {B}}(\mathbb {R} ^{d})\to [0,1]}

P X ( A ) = P ( X A ) ,       A B ( R d ) {\displaystyle P_{X}(A)=P(X\in A),\ \ \ A\in {\mathcal {B}}(\mathbb {R} ^{d})}

で定義される確率測度である。

確率変数 X の確率分布が μ であるとき、Xμ に従う確率変数であるといい、記号で X ~ μ と書く[2]。例えば、「X は平均 0、分散 1 の正規分布に従う」のように使い、これを

X N ( 0 , 1 ) {\displaystyle X\sim N(0,1)}

のように書く。

累積分布関数

詳細は「累積分布関数」を参照

実数値確率変数 X累積分布関数 (cumulative distribution function, CDF) あるいは一次元確率分布 PX の累積分布関数とは

F X ( x ) = P ( X x ) = P X ( ( , x ] ) {\displaystyle F_{X}(x)=P(X\leq x)=P_{X}((-\infty ,x])}

で与えられる関数 FX のことである。累積を省略して分布関数 (distribution function) とも言う。

累積分布関数は定義より右連続であるが、左連続とは限らない。累積分布関数が連続である(左連続でもある)確率分布を連続確率分布という。累積分布関数がとる値が高々可算個である確率分布を離散確率分布という。

確率密度関数

詳細は「確率密度関数」を参照

確率分布 PX絶対連続ならば、ある可測関数 f  : X → [0, ∞) が存在して、確率分布は

P ( X A ) = P X ( A ) = A f X ( x ) d x {\displaystyle P(X\in A)=P_{X}(A)=\int _{A}f_{X}(x)\,dx}

と表される(ラドン=ニコディムの定理)。fXPX のラドン=ニコディム微分であり、零集合を除いて一意である。fX を連続型確率変数 X確率密度関数 (probability density function, PDF) という。

確率分布 PX が絶対連続であるとは、任意の(ルベーグ測度に関しての)零集合 N に対して、

P X ( N ) = 0 {\displaystyle P_{X}(N)=0}

が成り立つことと定義される。これは測度の絶対連続性と同じである。このとき連続確率分布である。

とくに A が区間の場合は

P ( a < X < b ) = P ( a X < b ) = P ( a < X b ) = P ( a X b ) = a b f X ( x ) d x {\displaystyle P(a<X<b)=P(a\leq X<b)=P(a<X\leq b)=P(a\leq X\leq b)=\int _{a}^{b}f_{X}(x)\,dx}

となる。区間の端点は入れても入れなくても確率は同じである。

確率質量関数

詳細は「確率質量関数」を参照

離散確率分布のときに確率密度関数に対応する関数として確率質量関数 (probability mass function) がある。確率変数 X のとる値の集合が S = {x1, x2, …} だとすると確率質量関数は

f X ( x i ) = P ( X = x i ) = P X ( { x i } ) {\displaystyle f_{X}(x_{i})=P(X=x_{i})=P_{X}(\{x_{i}\})}

で定まる関数 fX のことである。日本語では確率関数とも略されるが、英語の probability function は意味が曖昧な言葉とされる。

多次元確率分布

2つ以上の変数の確率分布を、多次元確率分布と呼ぶ。2変数の確率確率分布を、二次元確率分布と呼ぶ[3]

同時分布

詳細は「同時分布」を参照

2つ以上の変数の組の確率分布のことを同時分布(どうじぶんぷ、joint distribution)、同時確率分布 (joint probability distribution) という[3]

周辺分布

詳細は「周辺分布」を参照

同時分布から各変数の分布だけを取り出したものを周辺分布(しゅうへんぶんぷ、marginal distribution)、周辺確率分布と呼ぶ。日本工業規格では、「k次元確率変数部分集合である k - 1変数の同時分布」と定義している[4]

確率分布の分類

まず確率変数が連続か離散かで分かれ、連続型確率変数の場合は累積分布関数が連続か絶対連続かで分類できる。

  • 離散型確率変数の確率分布
  • 連続型確率変数の確率分布
    • 連続確率分布
      • 絶対連続分布
      • 累積分布関数が連続だが絶対連続では無い確率分布
    • 累積分布関数が連続では無い確率分布

代表的な確率分布

よく使われる確率分布は離散確率分布と絶対連続確率分布である。

離散確率分布

詳細は「離散確率分布」を参照

サイコロを投げた時に出る目の数字など、確率変数が離散的な値をとる場合の確率分布は離散型確率分布である。パラメトリックな離散確率分布は母数(パラメータ)と台と確率質量関数 f で特徴付けられる。台というのは確率変数のとる値の集合のことである。

連続確率分布(絶対連続分布)

詳細は「連続確率分布」を参照

ある地点での通行人の体重など、確率変数が連続的な場合の確率分布のうち、累積分布関数が連続な確率分布が連続型確率分布である。パラメトリックな絶対連続分布は母数(パラメータ)と確率密度関数 f で特徴付けられる。

累積分布関数が連続だが絶対連続では無い確率分布

累積分布関数が連続では無い確率分布

確率分布の利用法

確率変数の確率分布が与えられると、その変数に関する確率期待値・分散などが以下のように計算できる。

X は連続型確率変数で確率密度関数fX であり、累積分布関数は FX とする。Y は離散型確率変数で台は S = {y1, y2, …}確率質量関数fY であるとする。

確率の計算

  • Xa 以上 b 以下の値を取る確率
    • P ( a X b ) = a b f X ( x ) d x {\displaystyle P(a\leq X\leq b)=\int _{a}^{b}f_{X}(x)\,dx}
    • P ( a X b ) = F X ( b ) F X ( a ) {\displaystyle P(a\leq X\leq b)=F_{X}(b)-F_{X}(a)}
  • Y の値が集合 T S {\displaystyle T\subset S} に属する確率
    • P ( Y T ) = y k T f Y ( y k ) {\displaystyle P(Y\in T)=\sum _{y_{k}\in T}f_{Y}(y_{k})}

期待値の計算

関数 g が与えられたときに g(X)g(Y) の期待値は

E [ g ( X ) ] = + g ( x ) f X ( x ) d x {\displaystyle E[g(X)]=\int _{-\infty }^{+\infty }g(x)f_{X}(x)\,dx}
E [ g ( Y ) ] = y k S g ( y k ) f Y ( y k ) {\displaystyle E[g(Y)]=\sum _{y_{k}\in S}g(y_{k})f_{Y}(y_{k})}

特に

E [ X ] = + x f X ( x ) d x {\displaystyle E[X]=\int _{-\infty }^{+\infty }xf_{X}(x)\,dx}
E [ Y ] = y k S y k f Y ( y k ) {\displaystyle E[Y]=\sum _{y_{k}\in S}y_{k}f_{Y}(y_{k})}

分散の計算

XY の分散は

V [ X ] = + ( x E [ X ] ) 2 f X ( x ) d x = + x 2 f X ( x ) d x E [ X ] 2 {\displaystyle V[X]=\int _{-\infty }^{+\infty }(x-E[X])^{2}f_{X}(x)\,dx=\int _{-\infty }^{+\infty }x^{2}f_{X}(x)\,dx-E[X]^{2}}
V [ Y ] = y k S ( y k E [ Y ] ) 2 f Y ( y k ) = y k S y k 2 f Y ( y k ) E [ Y ] 2 {\displaystyle V[Y]=\sum _{y_{k}\in S}(y_{k}-E[Y])^{2}f_{Y}(y_{k})=\sum _{y_{k}\in S}{y_{k}}^{2}f_{Y}(y_{k})-E[Y]^{2}}

変数変換

確率変数の変数変換による新しい変数の密度関数は、元の変数の密度関数で書くことができる。この公式は重積分における変数変換とほぼ同様である。

確率密度関数の変数変換公式

R d {\displaystyle \mathbb {R} ^{d}} から R d {\displaystyle \mathbb {R} ^{d}} への変換 T により、 R d {\displaystyle \mathbb {R} ^{d}} 値確率変数 XY

X = T ( Y ) {\displaystyle X=T(Y)}

と書けているとすると、Y確率密度関数X の確率密度関数を用いて

f Y ( y 1 , , y d ) = | ( det J T ) ( y 1 , , y d ) | f X ( T ( y 1 , , y d ) ) {\displaystyle f_{Y}(y_{1},\cdots ,y_{d})=|(\det J_{T})(y_{1},\cdots ,y_{d})|f_{X}(T(y_{1},\cdots ,y_{d}))}

となる。ただし Jヤコビアンとする。

例えばボックス-ミューラー変換(0, 1]2 上の一様分布に従う確率変数 X = (X1, X2)

Y 1 = 2 ln X 1 sin ( 2 π X 2 ) {\displaystyle Y_{1}={\sqrt {-2\ln X_{1}}}\sin(2\pi X_{2})}
Y 2 = 2 ln X 1 cos ( 2 π X 2 ) {\displaystyle Y_{2}={\sqrt {-2\ln X_{1}}}\cos(2\pi X_{2})}

によって変換する。X の密度関数は

f X ( x 1 , x 2 ) = { 1 , ( x 1 , x 2 ) ( 0 , 1 ] 2 0 , ( x 1 , x 2 ) ( 0 , 1 ] 2 {\displaystyle f_{X}(x_{1},x_{2})={\begin{cases}1,&(x_{1},x_{2})\in (0,1]^{2}\\0,&(x_{1},x_{2})\notin (0,1]^{2}\end{cases}}}

であり、上の公式を当てはめると Y の確率密度関数は

f Y ( y 1 , y 2 ) = 1 2 π exp ( y 1 2 + y 2 2 2 ) {\displaystyle f_{Y}(y_{1},y_{2})={\frac {1}{2\pi }}\exp \left(-{\frac {{y_{1}}^{2}+{y_{2}}^{2}}{2}}\right)}

となり、Y が二次元の標準正規分布に従うことが分かる。このように単純な分布を持つ変数を変換して、複雑な分布を作る操作は計算機による乱数の生成で重要となる。

確率変数の和の確率分布

2つの確率変数 XY の和 X + Y の確率分布や差 XY の確率分布は変数変換公式により計算できる。特に XY が独立で、確率密度関数がそれぞれ fXfY だったとすると、和と差の確率密度関数は

f X + Y ( t ) = + f X ( t y ) f Y ( y ) d y {\displaystyle f_{X+Y}(t)=\int _{-\infty }^{+\infty }f_{X}(t-y)f_{Y}(y)\,dy}
f X Y ( t ) = + f X ( t + y ) f Y ( y ) d y {\displaystyle f_{X-Y}(t)=\int _{-\infty }^{+\infty }f_{X}(t+y)f_{Y}(y)\,dy}

となる。

特に和の確率密度関数は2つの分布の確率密度関数の畳み込みである。また、特性関数は確率密度関数のフーリエ変換であり、畳み込みのフーリエ変換は周波数領域における積であることから、和の特性関数は2つの分布の特性関数の積となる。

なお、確率変数の和の確率分布が元の分布族に従う場合、その分布は再生性があるという。

確率モデル

パーコレーション
パーコレーションを参照。浸透 (percolation) 確率に基づくモデル。具体的には森林火災の広がり、伝染病の伝搬、金属と絶縁体の混合物、強磁性元素と非磁性元素の混晶系、分子間の重合による巨大高分子のゲル化などがある[5]
分岐過程
分岐過程 (branching process) は、生命の数変化モデル[6]
ランダムウォーク
ランダムウォークを参照。
無限粒子系
無限粒子の遷移率の連続時間のモデル[7]
凝集
拡散律速凝集 (DLA : diffusion limited aggregation) と呼ぶ、ヴィッテンとサンダーによる粒子のクラスターが凝集によって成長するモデル。
砂山崩し
バックたちによる砂山の斜面の崩壊を表すモデル。
渋滞
交通流の渋滞モデル。
生命
生命の時間的空間的モデル。セルオートマトンとも呼ぶ。生命競技 (life game) は2次元セルオートマトンの一種である。
排他過程
排他過程 (exclusion process) は、連続時間で発展する確率モデル。上記生命モデルが離散時間の決定論的モデルであるのに対応している[8]

脚注

[脚注の使い方]

出典

  1. ^ JIS Z 8101-1 : 1999, 1.3 確率分布.
  2. ^ Klenke, Achim (2014). Probability Theory: A Comprehensive Course (Second ed.). Springer. p. 41. ISBN 978-1-4471-5360-3. "We write X μ {\displaystyle X\sim \mu } if μ = P X {\displaystyle \mu =\mathbf {P} _{X}} and say that X {\displaystyle X} has distribution μ {\displaystyle \mu } ." 
  3. ^ a b JIS Z 8101-1 : 1999, 1.4 2次元分布関数.
  4. ^ JIS Z 8101-1 : 1999, 1.6 周辺分布.
  5. ^ 今野 1995, 第1章パーコレーションのモデル.
  6. ^ 今野 1995, 第2章分岐過程.
  7. ^ 今野 1995, 第4章無限粒子系.
  8. ^ 今野 1995, 第5章その他のモデル.

注釈

  1. ^ 標本点あるいは結果 (確率論)のこと

参考文献

関連項目

確率分布
離散単変量で
有限台
離散単変量で
無限台
  • ベータ負二項(英語版)
  • ボレル(英語版)
  • コンウェイ–マクスウェル–ポワソン(英語版)
  • 離散位相型(英語版)
  • ドラポルト(英語版)
  • 拡張負二項(英語版)
  • ガウス–クズミン
  • 幾何
  • 対数(英語版)
  • 負の二項
  • 放物フラクタル(英語版)
  • ポワソン
  • スケラム(英語版)
  • ユール–サイモン(英語版)
  • ゼータ(英語版)
連続単変量で
有界区間に台を持つ
  • 逆正弦(英語版)
  • ARGUS(英語版)
  • バルディング–ニコルス(英語版)
  • ベイツ(英語版)
  • ベータ
  • beta rectangular(英語版)
  • アーウィン–ホール(英語版)
  • クマラスワミー(英語版)
  • ロジット-正規(英語版)
  • 非中心ベータ(英語版)
  • raised cosine(英語版)
  • reciprocal(英語版)
  • 三角
  • U-quadratic(英語版)
  • 一様
  • ウィグナー半円
連続単変量で
半無限区間に台を持つ
  • ベニーニ(英語版)
  • ベンクタンダー第一種(英語版)
  • ベンクタンダー第二種(英語版)
  • 第2種ベータ
  • Burr(英語版)
  • カイ二乗
  • カイ(英語版)
  • Dagum(英語版)
  • デービス(英語版)
  • 指数-対数(英語版)
  • アーラン
  • 指数
  • F
  • folded normal(英語版)
  • Flory–Schulz(英語版)
  • フレシェ
  • ガンマ
  • gamma/Gompertz(英語版)
  • 一般逆ガウス(英語版)
  • Gompertz(英語版)
  • half-logistic(英語版)
  • half-normal(英語版)
  • Hotelling's T-squared(英語版)
  • 超アーラン(英語版)
  • 超指数(英語版)
  • hypoexponential(英語版)
  • 逆カイ二乗(英語版)
    • scaled inverse chi-squared(英語版)
  • 逆ガウス
  • 逆ガンマ
  • コルモゴロフ
  • レヴィ
  • 対数コーシー
  • 対数ラプラス(英語版)
  • 対数ロジスティック(英語版)
  • 対数正規
  • ロマックス(英語版)
  • 行列指数(英語版)
  • マクスウェル–ボルツマン
  • マクスウェル–ユットナー(英語版)
  • ミッタク-レフラー(英語版)
  • 仲上(英語版)
  • 非心カイ二乗
  • パレート
  • 位相型(英語版)
  • poly-Weibull(英語版)
  • レイリー
  • relativistic Breit–Wigner(英語版)
  • ライス(英語版)
  • shifted Gompertz(英語版)
  • 切断正規
  • タイプ2ガンベル(英語版)
  • ワイブル
    • 離散ワイブル(英語版)
  • ウィルクスのラムダ(英語版)
連続単変量で
実数直線全体に台を持つ
連続単変量で
タイプの変わる台を持つ
  • 一般極値
  • 一般パレート(英語版)
  • マルチェンコ–パストゥール(英語版)
  • q-指数(英語版)
  • q-ガウス
  • q-ワイブル(英語版)
  • shifted log-logistic(英語版)
  • トゥーキーのラムダ(英語版)
混連続-離散単変量
  • rectified Gaussian(英語版)
多変量 (結合)
【離散】
エウェンズ(英語版)
多項
ディリクレ多項(英語版)
負多項(英語版)
【連続】
ディリクレ
一般ディリクレ(英語版)
多変量正規
多変量安定(英語版)
多変量 t(英語版)
正規逆ガンマ(英語版)
正規ガンマ(英語版)
行列値
逆行列ガンマ(英語版)
逆ウィッシャート(英語版)
行列正規(英語版)
行列 t(英語版)
行列ガンマ(英語版)
正規逆ウィッシャート(英語版)
正規ウィッシャート(英語版)
ウィッシャート
方向
【単変量 (円周) 方向
円周一様(英語版)
単変数フォン・ミーゼス
wrapped 正規(英語版)
wrapped コーシー(英語版)
wrapped 指数(英語版)
wrapped 非対称ラプラス(英語版)
wrapped レヴィ(英語版)
【二変量 (球面)】
ケント(英語版)
【二変量 (トロイダル)】
二変数フォン・ミーゼス(英語版)
【多変量】
フォン・ミーゼス–フィッシャー(英語版)
ビンガム(英語版)
退化特異
  • 円周(英語版)
  • 混合ポワソン(英語版)
  • 楕円(英語版)
  • 指数
  • 自然指数(英語版)
  • 位置尺度(英語版)
  • 最大エントロピー(英語版)
  • 混合(英語版)
  • ピアソン(英語版)
  • トウィーディ(英語版)
  • wrapped(英語版)
サンプリング法(英語版)
  • 一覧記事 一覧(英語版)
  • カテゴリ カテゴリ
確率の歴史
確率の定義
客観確率
  • 統計的確率
  • 古典的確率
  • 公理的確率
主観確率
確率の拡張
基礎概念
モデル
確率変数
確率分布
関数
用語
確率の解釈
問題
法則・定理
測度論
確率微分方程式
確率過程
情報量
応用
数理ファイナンス
系統学
カテゴリ カテゴリ
典拠管理データベース: 国立図書館 ウィキデータを編集
  • フランス
  • BnF data
  • ドイツ
  • イスラエル
  • アメリカ
  • 日本
  • チェコ