Image




 目次

  ・確率分布

  ・期待値

  ・分散




この記事を読む助けになる数学の記事
数値計算1話2話5話6話8話13話14話15話16話17話






カヤ

今回は事象を数値に置き換えて考える確率分布というものを考えてみよう。

  確率分布


ナユミ

事象を数値に置き換える…、ゲームスコアみたいなものかな。

カヤ

そんな感じだな。まずは、一般的な確率分布の定義を書いておこう。
\[ 確率変数と確率分布\]  確率空間 \( \left( \Omega , \mathfrak F \rm , \it P \rm \right) \) について、各々の根元事象に応じてただ一つの値が定まる変数 \( X \) を確率変数と呼ぶ。確率変数 \( X \) のとる値と、それに対応する根元事象の確率との対応関係を確率分布と呼ぶ。確率変数 \( X \) の値が \( a \) となる確率を \( P \left( X = a \right) \) と表し、\( X \) が \( a \) 以上 \( b \) 以下の値をとる確率を \( P \left( a \leq X \leq b \right) \) と表す。

カヤ

まずは、標本空間が有限集合の場合に確率分布を構成する方法を見てみよう。
\[ \begin{align} 確率分 & 布の構成 \\ (標本空間が有 & 限集合の場合) \end{align}\]  標本空間 \( \Omega \) が有限集合の場合、\( \Omega \) の元である根元事象 \( e_1,\ e_2,\cdots ,\ e_n \) のそれぞれに確率変数 \( x_1,\ x_2,\cdots ,\ x_n \) が対応するならば、次が成り立つ。 \[ P \left( X = x_i \right) = P \left( e_i \right) \geq 0 \ \ \ \left( i=1,\ 2,\cdots ,\ n \right) \] \[ \sum _{i=1} ^n P \left( X = x_i \right) = \sum _{i=1} ^n P \left( e_i \right) = 1\]

ナユミ

標本空間が無限集合の場合はどうなるの?

カヤ

その場合は根元事象が連続した実数値を取ると仮定した上で、次のように定義する。
\[ \begin{align} 確率分 & 布の構成 \\ (標本空間が無 & 限集合の場合) \end{align}\]  標本空間 \( \Omega \) が無限集合の場合、根元事象 \( e \in \Omega \) が \( - \infty \leq a \leq e \leq b \leq \infty \) を満たす実数値をとるなら、根元事象 \( e \in \Omega \) に対応する確率変数 \( X \) を \( X = e \) とする。また、 \[ \left[ a, \ b \right] \ において \ f \left( x \right) \geq 0 \] \[ \int _a ^b f \left( x \right) dx = 1\] を満たす \( X \) の確率密度関数 \( f(x) \) を用いて、確率分布を次で表す。 \[ \begin{align} &P \left( X = c \right) = \int _c ^c f \left( x \right) dx = 0 \ \ \ \ \left( c \in \left[ a, \ b \right] \right) \\\\ &P \left( \alpha \leq X \leq \beta \right) = \int _{\alpha} ^{\beta} f \left( x \right) dx \ \ \ \ \left( a \leq \alpha \leq \beta \leq b \right) \end{align}\]

 標本空間が無限集合の場合は確率を確率密度関数の定積分で表します。

カヤ

次は期待値について説明しよう。




  期待値


ナユミ

期待値?ご期待くださいってこと?

カヤ

うん、まあちょっと違うかな。定義はこうだ。
\[ 期待値\]  確率変数 \( X \) のとる値の個数が有限であり、それが \( x_1,\ x_2, \ \cdots ,\ x_n \) と与えられたとき、確率変数 \( X \) の期待値または平均と呼ばれる値 \( E(X) \) は次式で定義される。 \[ E(X) = \sum _{i=1} ^n x_i \cdot P \left( X = x_i \right) \] また、確率変数 \( X \) が、\( - \infty \leq a \leq X \leq b \leq \infty \) を満たす実数値をとるなら、確率変数 \( X \) の期待値 \( E(X) \) は \( X \) の確率密度関数 \( f(x) \) を用いて次式で定義される。 \[ E(X) = \int _a ^b x f(x) dx \]

 標本空間が有限集合のときは確率変数と確率をかけたものの総和が、標本空間が無限集合のときは確率変数と確率密度関数をかけたものを標本空間全体にわたって積分したものがそれぞれ期待値になります。 例えば、さいころを1回投げるときに出る目の期待値は次の通りです。

 さいころを1回投げるとき、確率変数 \( X \) を \[ X = \left\{ 1, \ 2, \ 3, \ 4, \ 5, \ 6\right\}\] とすれば、 \[ P \left( X = i \right) = \frac{1}{6} \ \ \ \ \left( i=1, \ 2, \ 3, \ 4, \ 5, \ 6\right)\] であるから、期待値 \( E(X) \) は、 \[ E(X) = \sum _{i=1} ^6 i \cdot \frac{1}{6} = 3.5\]

カヤ

次は期待値の性質についていくつか見てみよう。
\[ 期待値の平行移動・定数倍\]  確率変数 \( X \) の期待値について、\( a \) を定数とすると次が成り立つ。 \[ E(X+a) = E(X) + a \] \[ E(aX) = aE(X) \]

ナユミ

ふむ、よく見かける感じの公式ね。

カヤ

そうだな。それぞれについて、標本空間が有限集合のときと無限集合のときそれぞれについて証明していこう。
有限集合の場合 \[ \begin{align} E(X+a) &= \sum _{i=1} ^n \left( x_i + a \right) \cdot P \left( X = x_i \right) \\\\ &= \sum _{i=1} ^n x_i \cdot P \left( X = x_i \right) + a \sum _{i=1} ^n P \left( X = x_i \right) \\\\ &= E(X) + a \end{align}\] 無限集合の場合 \[ \begin{align} E(X+a) &= \int _a ^b \left( x + a \right) f(x) dx \\\\ &= \int _a ^b x f(x) dx + a \int _a ^b f(x) dx \\\\ &= E(X) + a \end{align}\]

ナユミ

どちらも2つに分離してから、全体にわたって足したり、積分したりしたら1になるって性質を使ってるのね。

カヤ

そうだな。次は2つめの定数倍の公式だ。
有限集合の場合 \[ \begin{align} E(aX) &= \sum _{i=1} ^n ax_i \cdot P \left( X = x_i \right) \\\\ &= a \sum _{i=1} ^n x_i \cdot P \left( X = x_i \right) \\\\ &= aE(X) \end{align}\] 無限集合の場合 \[ \begin{align} E(aX) &= \int _a ^b ax f(x) dx \\\\ &= a \int _a ^b x f(x) dx \\\\ &= aE(X) \end{align}\]

ナユミ

\( a \) を \( \sum \) や \( \int \) の外側に出しただけね。

カヤ

そうだな。次に、確率空間の積において定義される期待値についての公式だ。
\[ 確率空間の積の期待値 \]  確率空間 \( \left( \Omega _1 , \mathcal P \rm ( \Omega _1) , \it P \rm _1 \right) \) の確率変数を \( X \) とし、確率空間 \( \left( \Omega _2 , \mathcal P \rm ( \Omega _2) , \it P \rm _2 \right) \) の確率変数を \( Y \) とする。 これら2つの確率空間の積において定義される \( E(X+Y) \) と \( E(XY) \) について、次が成り立つ。 \[ E(X+Y) = E(X) + E(Y) \] \[ E(XY) = E(X) \cdot E(Y)\]

ナユミ

これもよく見かけるタイプの公式ね。

カヤ

そうだな。まずは和の公式を証明しよう。
有限集合の場合 \[ \begin{align} E(X+Y) &= \sum _{i=1} ^n \sum _{j=1} ^m \left( x_i + y_j \right) \cdot P \left( X = x_i \right) \cdot P \left( Y = y_j \right) \\\\ &= \sum _{i=1} ^n \sum _{j=1} ^m x_i \cdot P \left( X = x_i \right) \cdot P \left( Y = y_j \right) + \sum _{i=1} ^n \sum _{j=1} ^m y_j \cdot P \left( X = x_i \right) \cdot P \left( Y = y_j \right) \\\\ &= \sum _{i=1} ^n x_i \cdot P \left( X = x_i \right) \sum _{j=1} ^m P \left( Y = y_j \right) + \sum _{i=1} ^n P \left( X = x_i \right) \sum _{j=1} ^m y_j \cdot P \left( Y = y_j \right) \\\\ &= E(X) + E(Y) \end{align}\] 無限集合の場合 \[ \begin{align} E(X+Y) &= \int _a ^b \left( \int _c ^d \left( x + y \right) f(x)g(y) dy \right) dx \\\\ &= \int _a ^b \left( x f(x) \int _c ^d g(y) dy + f(x) \int _c ^d y g(y) dy \right) dx \\\\ &= \int _a ^b \left( x f(x) + f(x) E(Y) \right) dx \\\\ &= \int _a ^b x f(x) dx + E(Y) \int _a ^b f(x) dx \\\\ &= E(X) + E(Y) \end{align}\]

ナユミ

ごちゃごちゃはしてるけど、やってることはかっこをばらすことと、\( \sum \) や \( \int \) の外側に出せる部分は出して、全体にわたって足したり積分したら1になるって性質を使うってことね。

カヤ

そういうことだな。次は、積の公式だ。
有限集合の場合 \[ \begin{align} E(XY) &= \sum _{i=1} ^n \sum _{j=1} ^m x_i y_j \cdot P \left( X = x_i \right) \cdot P \left( Y = y_j \right) \\\\ &= \sum _{i=1} ^n x_i \cdot P \left( X = x_i \right) \sum _{j=1} ^m y_j \cdot P \left( Y = y_j \right) \\\\ &= E(X) \cdot E(Y) \end{align}\] 無限集合の場合 \[ \begin{align} E(XY) &= \int _a ^b \left( \int _c ^d xy f(x)g(y) dy \right) dx \\\\ &= \int _a ^b \left( xf(x) \int _c ^d y g(y) dy \right) dx \\\\ &= \int _a ^b xf(x) \cdot E(Y) dx \\\\ &= E(Y) \int _a ^b xf(x) dx \\\\ &= E(X) \cdot E(Y) \end{align}\]

ナユミ

和の公式と同じ要領ね。

カヤ

そんな感じだな。じゃあ次は、期待値に続いて分散について解説しよう。




  分散


ナユミ

分散…、散らかってるってこと?

カヤ

まあそうだな。確率分布の期待値周りでの散らかり具合を表現したものの一つが分散だな。
\[ 分散\]  確率変数 \( X \) の期待値を \( E(X) \) と表すとき、確率変数 \( X \) の分散 \( V(X) \) は次式で定義される。 \[ V(X) = E \left( \left( X - E(X) \right) ^2 \right) \] 分散 \( V(X) \) は次式で求めることもできる。 \[ V(X) = E(X^2) - \left\{ E(X) \right\}^2 \]

ナユミ

ふーん、求め方が2つあるのね。

カヤ

標本空間が有限集合の場合と無限集合の場合それぞれについて、上の式から下の式を導いてみよう。
有限集合の場合 \[ \begin{align} V(X) &= E \left( \left( X - E(X) \right) ^2 \right) \\\\ &= \sum _{i=1} ^n \left( x_i - E(X) \right) ^2 \cdot P \left( X = x_i \right) \\\\ &= \sum _{i=1} ^n \left( x_i^2 - 2x_iE(X) + \left\{ E(X) \right\}^2 \right) \cdot P \left( X = x_i \right) \\\\ &= \sum _{i=1} ^n x_i^2 \cdot P \left( X = x_i \right) -2E(X) \sum _{i=1} ^n x_i \cdot P \left( X = x_i \right) + \left\{ E(X) \right\}^2 \sum _{i=1} ^n \cdot P \left( X = x_i \right) \\\\ &= E(X^2) -2 \left\{ E(X) \right\}^2 + \left\{ E(X) \right\}^2 \\\\ &= E(X^2) - \left\{ E(X) \right\}^2 \end{align}\] 無限集合の場合 \[ \begin{align} V(X) &= E \left( \left( X - E(X) \right) ^2 \right) \\\\ &= \int _a ^b \left( x - E(X) \right) ^2 \cdot f(x) dx \\\\ &= \int _a ^b \left( x^2 - 2xE(X) + \left\{ E(X) \right\}^2 \right) \cdot f(x) dx \\\\ &= \int _a ^b x^2 f(x) dx - 2E(X) \int _a ^b x f(x) dx + \left\{ E(X) \right\}^2 \int _a ^b f(x) dx \\\\ &= E(X^2) -2 \left\{ E(X) \right\}^2 + \left\{ E(X) \right\}^2 \\\\ &= E(X^2) - \left\{ E(X) \right\}^2 \end{align}\]

 ここでの \( E(X^2) \) は確率空間の積の期待値の \( E(XY) \) で \( Y = X \) としたものとは一般に異なります。 確率空間の積の期待値 \( E(XY) \) で \( Y=X \) と置いたものは、 \[ E(X) \cdot E(X) = \left\{ E(X) \right\}^2 \] となるため、今導出した式から両者の値の差は \( V(X) \) になります。

ナユミ

\( E(X^2) \) と \( \left\{ E(X) \right\}^2 \) 、紛らわしいから気を付けるわ。

カヤ

そうしてくれ。じゃあ次に、分散の平行移動と定数倍について成り立つ公式を紹介しておこう。
\[ 分散の平行移動・定数倍\]  確率変数 \( X \) の分散について、\( a \) を定数とすると次が成り立つ。 \[ V(X+a) = V(X) \] \[ V(aX) = a^2 V(X) \]

ナユミ

ふむ、平行移動しても結果は変わらず、定数倍は2乗した定数をかけるのね。

カヤ

そうだな。平行移動の方から証明しよう。
\[ \begin{align} V(X+a) &= E( \left( X+a \right) ^2) - \left\{ E(X+a) \right\}^2 \\\\ &= E(X^2 + 2aX + a^2) - \left\{ E(X)+a \right\}^2 \\\\ &= E(X^2) + 2aE(X) + a^2 - \left\{ E(X) \right\}^2 -2aE(X) -a^2 \\\\ &= E(X^2) - \left\{ E(X) \right\}^2 \\\\ &= V(X) \end{align}\]

ナユミ

期待値の性質を上手く使っているわね。

カヤ

そうだな。次は定数倍のほう。
\[ \begin{align} V(aX) &= E( \left( aX \right) ^2) - \left\{ E(aX) \right\}^2 \\\\ &= E(a^2X^2) - \left\{ aE(X) \right\}^2 \\\\ &= a^2E(X^2) - a^2 \left\{ E(X) \right\}^2 \\\\ &= a^2 \left\{ E(X^2) - \left\{ E(X) \right\}^2 \right\} \\\\ &= a^2 V(X) \end{align}\]

ナユミ

似たような感じね。

カヤ

そうだな。じゃあ最後に確率空間の積において定義される分散についての公式だ。
\[ 確率空間の積の分散\]  確率空間 \( \left( \Omega _1 , \mathcal P \rm ( \Omega _1) , \it P \rm _1 \right) \) の確率変数を \( X \) とし、確率空間 \( \left( \Omega _2 , \mathcal P \rm ( \Omega _2) , \it P \rm _2 \right) \) の確率変数を \( Y \) とする。 これら2つの確率空間の積において定義される \( V(X+Y) \) について、次が成り立つ。 \[ V(X+Y) = V(X) + V(Y) \]

ナユミ

期待値と同じ形の公式ね。

カヤ

そうだな。証明は次の通りだ。
\[ \begin{align} V(X+Y) &= E \left( \left( X + Y \right)^2 \right) - \left\{ E \left( X + Y \right) \right\} ^2 \\\\ &= E \left( X^2 + 2XY + Y^2 \right) - \left\{ E \left( X \right) + E \left( Y \right) \right\} ^2 \\\\ &= E \left( X^2 \right) + 2E \left( XY \right) + E \left( Y^2 \right) - \left\{ E \left( X \right) \right\} ^2 -2 E \left( X \right) \cdot E \left( Y \right) - \left\{ E \left( Y \right) \right\} ^2 \\\\ &= E \left( X^2 \right) + 2E \left( X \right) \cdot E \left( Y \right) + E \left( Y^2 \right) - \left\{ E \left( X \right) \right\} ^2 -2 E \left( X \right) \cdot E \left( Y \right) - \left\{ E \left( Y \right) \right\} ^2 \\\\ &= E \left( X^2 \right) - \left\{ E \left( X \right) \right\} ^2 + E \left( Y^2 \right) - \left\{ E \left( Y \right) \right\} ^2 \\\\ &= V(X) + V(Y) \end{align}\]

ナユミ

確率空間の積の期待値の公式を使っているのね。

カヤ

そうだな。じゃあ今回はここまで。



参考:
[1] 宮西正宜 他23名、高等学校 数学C 改訂版、新興出版社啓林館、2010年12月10日発行
[2] A.N.Kolmogorov 著、Nathan Morrison 英訳、FOUNDATIONS OF THE THEORY OF PROBABILITY、CHELSEA PUBLISHING COMPANY NEW YORK、1950年