目次
・確率分布
・期待値
・分散
確率分布
\[ 確率変数と確率分布\]
確率空間 \( \left( \Omega , \mathfrak F \rm , \it P \rm \right) \) について、各々の根元事象に応じてただ一つの値が定まる変数 \( X \) を確率変数と呼ぶ。確率変数 \( X \) のとる値と、それに対応する根元事象の確率との対応関係を確率分布と呼ぶ。確率変数 \( X \) の値が \( a \) となる確率を \( P \left( X = a \right) \) と表し、\( X \) が \( a \) 以上 \( b \) 以下の値をとる確率を \( P \left( a \leq X \leq b \right) \) と表す。
\[ \begin{align}
確率分 & 布の構成 \\
(標本空間が有 & 限集合の場合)
\end{align}\]
標本空間 \( \Omega \) が有限集合の場合、\( \Omega \) の元である根元事象 \( e_1,\ e_2,\cdots ,\ e_n \) のそれぞれに確率変数 \( x_1,\ x_2,\cdots ,\ x_n \) が対応するならば、次が成り立つ。
\[ P \left( X = x_i \right) = P \left( e_i \right) \geq 0 \ \ \ \left( i=1,\ 2,\cdots ,\ n \right) \]
\[ \sum _{i=1} ^n P \left( X = x_i \right) = \sum _{i=1} ^n P \left( e_i \right) = 1\]
\[ \begin{align}
確率分 & 布の構成 \\
(標本空間が無 & 限集合の場合)
\end{align}\]
標本空間 \( \Omega \) が無限集合の場合、根元事象 \( e \in \Omega \) が \( - \infty \leq a \leq e \leq b \leq \infty \) を満たす実数値をとるなら、根元事象 \( e \in \Omega \) に対応する確率変数 \( X \) を \( X = e \) とする。また、
\[ \left[ a, \ b \right] \ において \ f \left( x \right) \geq 0 \]
\[ \int _a ^b f \left( x \right) dx = 1\]
を満たす \( X \) の確率密度関数 \( f(x) \) を用いて、確率分布を次で表す。
\[ \begin{align}
&P \left( X = c \right) = \int _c ^c f \left( x \right) dx = 0 \ \ \ \ \left( c \in \left[ a, \ b \right] \right) \\\\
&P \left( \alpha \leq X \leq \beta \right) = \int _{\alpha} ^{\beta} f \left( x \right) dx \ \ \ \ \left( a \leq \alpha \leq \beta \leq b \right)
\end{align}\]
標本空間が無限集合の場合は確率を確率密度関数の定積分で表します。
期待値
\[ 期待値\]
確率変数 \( X \) のとる値の個数が有限であり、それが \( x_1,\ x_2, \ \cdots ,\ x_n \) と与えられたとき、確率変数 \( X \) の期待値または平均と呼ばれる値 \( E(X) \) は次式で定義される。
\[ E(X) = \sum _{i=1} ^n x_i \cdot P \left( X = x_i \right) \]
また、確率変数 \( X \) が、\( - \infty \leq a \leq X \leq b \leq \infty \) を満たす実数値をとるなら、確率変数 \( X \) の期待値 \( E(X) \) は \( X \) の確率密度関数 \( f(x) \) を用いて次式で定義される。
\[ E(X) = \int _a ^b x f(x) dx \]
標本空間が有限集合のときは確率変数と確率をかけたものの総和が、標本空間が無限集合のときは確率変数と確率密度関数をかけたものを標本空間全体にわたって積分したものがそれぞれ期待値になります。
例えば、さいころを1回投げるときに出る目の期待値は次の通りです。
さいころを1回投げるとき、確率変数 \( X \) を
\[ X = \left\{ 1, \ 2, \ 3, \ 4, \ 5, \ 6\right\}\]
とすれば、
\[ P \left( X = i \right) = \frac{1}{6} \ \ \ \ \left( i=1, \ 2, \ 3, \ 4, \ 5, \ 6\right)\]
であるから、期待値 \( E(X) \) は、
\[ E(X) = \sum _{i=1} ^6 i \cdot \frac{1}{6} = 3.5\]
\[ 期待値の平行移動・定数倍\]
確率変数 \( X \) の期待値について、\( a \) を定数とすると次が成り立つ。
\[ E(X+a) = E(X) + a \]
\[ E(aX) = aE(X) \]
有限集合の場合
\[ \begin{align}
E(X+a) &= \sum _{i=1} ^n \left( x_i + a \right) \cdot P \left( X = x_i \right) \\\\
&= \sum _{i=1} ^n x_i \cdot P \left( X = x_i \right) + a \sum _{i=1} ^n P \left( X = x_i \right) \\\\
&= E(X) + a
\end{align}\]
無限集合の場合
\[ \begin{align}
E(X+a) &= \int _a ^b \left( x + a \right) f(x) dx \\\\
&= \int _a ^b x f(x) dx + a \int _a ^b f(x) dx \\\\
&= E(X) + a
\end{align}\]
有限集合の場合
\[ \begin{align}
E(aX) &= \sum _{i=1} ^n ax_i \cdot P \left( X = x_i \right) \\\\
&= a \sum _{i=1} ^n x_i \cdot P \left( X = x_i \right) \\\\
&= aE(X)
\end{align}\]
無限集合の場合
\[ \begin{align}
E(aX) &= \int _a ^b ax f(x) dx \\\\
&= a \int _a ^b x f(x) dx \\\\
&= aE(X)
\end{align}\]
\[ 確率空間の積の期待値 \]
確率空間 \( \left( \Omega _1 , \mathcal P \rm ( \Omega _1) , \it P \rm _1 \right) \) の確率変数を \( X \) とし、確率空間 \( \left( \Omega _2 , \mathcal P \rm ( \Omega _2) , \it P \rm _2 \right) \) の確率変数を \( Y \) とする。
これら2つの確率空間の積において定義される \( E(X+Y) \) と \( E(XY) \) について、次が成り立つ。
\[ E(X+Y) = E(X) + E(Y) \]
\[ E(XY) = E(X) \cdot E(Y)\]
有限集合の場合
\[ \begin{align}
E(X+Y) &= \sum _{i=1} ^n \sum _{j=1} ^m \left( x_i + y_j \right) \cdot P \left( X = x_i \right) \cdot P \left( Y = y_j \right) \\\\
&= \sum _{i=1} ^n \sum _{j=1} ^m x_i \cdot P \left( X = x_i \right) \cdot P \left( Y = y_j \right) + \sum _{i=1} ^n \sum _{j=1} ^m y_j \cdot P \left( X = x_i \right) \cdot P \left( Y = y_j \right) \\\\
&= \sum _{i=1} ^n x_i \cdot P \left( X = x_i \right) \sum _{j=1} ^m P \left( Y = y_j \right) + \sum _{i=1} ^n P \left( X = x_i \right) \sum _{j=1} ^m y_j \cdot P \left( Y = y_j \right) \\\\
&= E(X) + E(Y)
\end{align}\]
無限集合の場合
\[ \begin{align}
E(X+Y) &= \int _a ^b \left( \int _c ^d \left( x + y \right) f(x)g(y) dy \right) dx \\\\
&= \int _a ^b \left( x f(x) \int _c ^d g(y) dy + f(x) \int _c ^d y g(y) dy \right) dx \\\\
&= \int _a ^b \left( x f(x) + f(x) E(Y) \right) dx \\\\
&= \int _a ^b x f(x) dx + E(Y) \int _a ^b f(x) dx \\\\
&= E(X) + E(Y)
\end{align}\]
有限集合の場合
\[ \begin{align}
E(XY) &= \sum _{i=1} ^n \sum _{j=1} ^m x_i y_j \cdot P \left( X = x_i \right) \cdot P \left( Y = y_j \right) \\\\
&= \sum _{i=1} ^n x_i \cdot P \left( X = x_i \right) \sum _{j=1} ^m y_j \cdot P \left( Y = y_j \right) \\\\
&= E(X) \cdot E(Y)
\end{align}\]
無限集合の場合
\[ \begin{align}
E(XY) &= \int _a ^b \left( \int _c ^d xy f(x)g(y) dy \right) dx \\\\
&= \int _a ^b \left( xf(x) \int _c ^d y g(y) dy \right) dx \\\\
&= \int _a ^b xf(x) \cdot E(Y) dx \\\\
&= E(Y) \int _a ^b xf(x) dx \\\\
&= E(X) \cdot E(Y)
\end{align}\]
分散
\[ 分散\]
確率変数 \( X \) の期待値を \( E(X) \) と表すとき、確率変数 \( X \) の分散 \( V(X) \) は次式で定義される。
\[ V(X) = E \left( \left( X - E(X) \right) ^2 \right) \]
分散 \( V(X) \) は次式で求めることもできる。
\[ V(X) = E(X^2) - \left\{ E(X) \right\}^2 \]
有限集合の場合
\[ \begin{align}
V(X) &= E \left( \left( X - E(X) \right) ^2 \right) \\\\
&= \sum _{i=1} ^n \left( x_i - E(X) \right) ^2 \cdot P \left( X = x_i \right) \\\\
&= \sum _{i=1} ^n \left( x_i^2 - 2x_iE(X) + \left\{ E(X) \right\}^2 \right) \cdot P \left( X = x_i \right) \\\\
&= \sum _{i=1} ^n x_i^2 \cdot P \left( X = x_i \right) -2E(X) \sum _{i=1} ^n x_i \cdot P \left( X = x_i \right) + \left\{ E(X) \right\}^2 \sum _{i=1} ^n \cdot P \left( X = x_i \right) \\\\
&= E(X^2) -2 \left\{ E(X) \right\}^2 + \left\{ E(X) \right\}^2 \\\\
&= E(X^2) - \left\{ E(X) \right\}^2
\end{align}\]
無限集合の場合
\[ \begin{align}
V(X) &= E \left( \left( X - E(X) \right) ^2 \right) \\\\
&= \int _a ^b \left( x - E(X) \right) ^2 \cdot f(x) dx \\\\
&= \int _a ^b \left( x^2 - 2xE(X) + \left\{ E(X) \right\}^2 \right) \cdot f(x) dx \\\\
&= \int _a ^b x^2 f(x) dx - 2E(X) \int _a ^b x f(x) dx + \left\{ E(X) \right\}^2 \int _a ^b f(x) dx \\\\
&= E(X^2) -2 \left\{ E(X) \right\}^2 + \left\{ E(X) \right\}^2 \\\\
&= E(X^2) - \left\{ E(X) \right\}^2
\end{align}\]
ここでの \( E(X^2) \) は確率空間の積の期待値の \( E(XY) \) で \( Y = X \) としたものとは一般に異なります。
確率空間の積の期待値 \( E(XY) \) で \( Y=X \) と置いたものは、
\[ E(X) \cdot E(X) = \left\{ E(X) \right\}^2 \]
となるため、今導出した式から両者の値の差は \( V(X) \) になります。
\[ 分散の平行移動・定数倍\]
確率変数 \( X \) の分散について、\( a \) を定数とすると次が成り立つ。
\[ V(X+a) = V(X) \]
\[ V(aX) = a^2 V(X) \]
\[ \begin{align}
V(X+a) &= E( \left( X+a \right) ^2) - \left\{ E(X+a) \right\}^2 \\\\
&= E(X^2 + 2aX + a^2) - \left\{ E(X)+a \right\}^2 \\\\
&= E(X^2) + 2aE(X) + a^2 - \left\{ E(X) \right\}^2 -2aE(X) -a^2 \\\\
&= E(X^2) - \left\{ E(X) \right\}^2 \\\\
&= V(X)
\end{align}\]
\[ \begin{align}
V(aX) &= E( \left( aX \right) ^2) - \left\{ E(aX) \right\}^2 \\\\
&= E(a^2X^2) - \left\{ aE(X) \right\}^2 \\\\
&= a^2E(X^2) - a^2 \left\{ E(X) \right\}^2 \\\\
&= a^2 \left\{ E(X^2) - \left\{ E(X) \right\}^2 \right\} \\\\
&= a^2 V(X)
\end{align}\]
\[ 確率空間の積の分散\]
確率空間 \( \left( \Omega _1 , \mathcal P \rm ( \Omega _1) , \it P \rm _1 \right) \) の確率変数を \( X \) とし、確率空間 \( \left( \Omega _2 , \mathcal P \rm ( \Omega _2) , \it P \rm _2 \right) \) の確率変数を \( Y \) とする。
これら2つの確率空間の積において定義される \( V(X+Y) \) について、次が成り立つ。
\[ V(X+Y) = V(X) + V(Y) \]
\[ \begin{align}
V(X+Y) &= E \left( \left( X + Y \right)^2 \right) - \left\{ E \left( X + Y \right) \right\} ^2 \\\\
&= E \left( X^2 + 2XY + Y^2 \right) - \left\{ E \left( X \right) + E \left( Y \right) \right\} ^2 \\\\
&= E \left( X^2 \right) + 2E \left( XY \right) + E \left( Y^2 \right) - \left\{ E \left( X \right) \right\} ^2 -2 E \left( X \right) \cdot E \left( Y \right) - \left\{ E \left( Y \right) \right\} ^2 \\\\
&= E \left( X^2 \right) + 2E \left( X \right) \cdot E \left( Y \right) + E \left( Y^2 \right) - \left\{ E \left( X \right) \right\} ^2 -2 E \left( X \right) \cdot E \left( Y \right) - \left\{ E \left( Y \right) \right\} ^2 \\\\
&= E \left( X^2 \right) - \left\{ E \left( X \right) \right\} ^2 + E \left( Y^2 \right) - \left\{ E \left( Y \right) \right\} ^2 \\\\
&= V(X) + V(Y)
\end{align}\]
参考:
[1] 宮西正宜 他23名、高等学校 数学C 改訂版、新興出版社啓林館、2010年12月10日発行
[2] A.N.Kolmogorov 著、Nathan Morrison 英訳、FOUNDATIONS OF THE THEORY OF PROBABILITY、CHELSEA PUBLISHING COMPANY NEW YORK、1950年