目次
・チェビシェフの不等式
チェビシェフの不等式
パフヌーティー・チェビシェフは19世紀に活躍したロシアの数学者です。
彼は確率論、統計学および数論の分野で業績を残しました。
彼が指導した数学者も多く、ロシアの数学の父とも呼ばれています。
彼の功績を称えて、月面にはチェビシェフという名前のクレーターがあり、
チェビシェフという名前の小惑星もあります。
パフヌーティー・チェビシェフ(1821-1894)
\[ 期待値に関する不等式\]
\( f(x) \) は実区間 \( I \) で定義された非負の単調増加関数とする。\( X \) を確率変数とすると、定数 \( \alpha \in I \ (ただし、f( \alpha ) \neq 0 )\) に対して次の不等式が成り立つ。
\[ P \left( X \geq \alpha \right) \leq \frac{E \left( f(X) \right)}{f( \alpha )}\]
同様に、\( g(x) \) を実区間 \( J \) で定義された非負の単調減少関数とすれば、定数 \( \beta \in J \ (ただし、g( \beta ) \neq 0 )\) に対して次の不等式が成り立つ。
\[ P \left( X \leq \beta \right) \leq \frac{E \left( g(X) \right)}{g( \beta )}\]
確率変数 \( X \) が、
\[ X = \left\{ X_1 , \ X_2, \cdots ,\ X_n \right\}\]
と表されており、
\[ X_i \leq X_{i+1} \]
\[ i \geq k \ ならば \ X_i \geq \alpha \]
\[ i \lt k \ ならば \ X_i \lt \alpha \]
が成り立つとする。このとき、
\[ \begin{align}
E \left( f(X) \right) &= \sum _{i=1} ^n f(X_i) \cdot P \left( X = X_i \right) \\\\
& \geq \sum _{i=k} ^n f(X_i) \cdot P \left( X = X_i \right) \\\\
& \geq f( \alpha ) \sum _{i=k} ^n P \left( X = X_i \right) \\\\
&= f( \alpha ) \cdot P \left( X \geq \alpha \right) \\\\
P \left( X \geq \alpha \right) & \leq \frac{E \left( f(X) \right)}{f( \alpha )}
\end{align}\]
確率変数 \( X \) が、
\[ X = \left\{ X_1 , \ X_2, \cdots ,\ X_n \right\}\]
と表されており、
\[ X_i \leq X_{i+1} \]
\[ i \gt k \ ならば \ X_i \gt \beta \]
\[ i \leq k \ ならば \ X_i \leq \beta \]
が成り立つとする。このとき、
\[ \begin{align}
E \left( g(X) \right) &= \sum _{i=1} ^n g(X_i) \cdot P \left( X = X_i \right) \\\\
& \geq \sum _{i=1} ^k g(X_i) \cdot P \left( X = X_i \right) \\\\
& \geq g( \beta ) \sum _{i=1} ^k P \left( X = X_i \right) \\\\
&= g( \beta ) \cdot P \left( X \leq \beta \right) \\\\
P \left( X \leq \beta \right) & \leq \frac{E \left( g(X) \right)}{g( \beta )}
\end{align}\]
確率変数 \( X \) が、\( - \infty \leq a \leq X \leq b \leq \infty \) を満たす実数値をとるとする。
また、\( X \) の確率密度関数を \( h(x) \) とすると、
\[ \begin{align}
E \left( f(X) \right) &= \int _a ^b f(x)h(x) dx \\\\
& \geq \int _{\alpha} ^b f(x)h(x) dx \\\\
& \geq f( \alpha ) \int _{\alpha} ^b h(x) dx \\\\
&= f( \alpha ) \cdot P \left( X \geq \alpha \right) \\\\
P \left( X \geq \alpha \right) & \leq \frac{E \left( f(X) \right)}{f( \alpha )}
\end{align}\]
確率変数 \( X \) が、\( - \infty \leq a \leq X \leq b \leq \infty \) を満たす実数値をとるとする。
また、\( X \) の確率密度関数を \( h(x) \) とすると、
\[ \begin{align}
E \left( g(X) \right) &= \int _a ^b g(x)h(x) dx \\\\
& \geq \int _{a} ^{\beta} g(x)h(x) dx \\\\
& \geq g( \beta ) \int _{a} ^{\beta} h(x) dx \\\\
&= g( \beta ) \cdot P \left( X \leq \beta \right) \\\\
P \left( X \leq \beta \right) & \leq \frac{E \left( g(X) \right)}{g( \beta )}
\end{align}\]
\[ チェビシェフの不等式\]
定数 \( c \gt 0 \) に対して、次の不等式が成り立つ。
\[ P \left( |X - E(X)| \geq c \right) \leq \frac{E \left( \left( X - E(X) \right) ^2 \right)}{c^2} = \frac{V(X)}{c^2} \]
この不等式の意味は「確率変数と期待値との差の絶対値が \( c \) 以上になる確率は、分散を \( c^2 \) で割ったもの以下である」ということです。
例えば、この不等式の定数に \( c = qE(X) \) と代入すれば、確率変数と期待値との差の絶対値が期待値の \( q \) 倍以上になる確率の上限値を評価することができます。
確率変数 \( X \) が、
\[ X = \left\{ X_1 , \ X_2, \cdots ,\ X_n \right\}\]
と表されており、
\[ X_i \leq X_{i+1} \]
\[ i \leq k \ \ ならば \ \ X_i - E(X) \leq -c \]
\[ k \lt i \lt l \ \ ならば \ \ -c \lt X_i - E(X) \lt c \]
\[ i \geq l \ \ ならば \ \ X_i - E(X) \geq c \]
が成り立つとする。このとき、
\[ \begin{align}
E \left( \left( X - E(X) \right) ^2 \right) &= \sum _{i=1} ^n \left( x_i - E(X) \right) ^2 \cdot P \left( X = X_i \right) \\\\
& \geq \sum _{i=1} ^{k} \left( x_i - E(X) \right) ^2 \cdot P \left( X = X_i \right) \\\\
& \ \ \ \ + \sum _{i=l} ^{n} \left( x_i - E(X) \right) ^2 \cdot P \left( X = X_i \right) \\\\
& \geq c^2 \left\{ \sum _{i=1} ^{k} P \left( X = X_i \right) + \sum _{i=l} ^{n} P \left( X = X_i \right) \right\} \\\\
&= c^2 P \left( |X - E(X)| \geq c \right) \\\\
P \left( |X - E(X)| \geq c \right) & \leq \frac{E \left( \left( X - E(X) \right) ^2 \right)}{c^2} = \frac{V(X)}{c^2}
\end{align}\]
確率変数 \( X \) が、\( - \infty \leq a \leq X \leq b \leq \infty \) を満たす実数値をとるとする。
また、\( X \) の確率密度関数を \( h(x) \) とすると、
\[ \begin{align}
E \left( \left( X - E(X) \right) ^2 \right) &= \int _{a} ^b \left( x - E(X) \right) ^2 h(x) dx \\\\
& \geq \int _{a} ^{-c + E(X)} \left( x - E(X) \right) ^2 h(x) dx \\\\
& \ \ \ \ + \int _{c + E(X)} ^{b} \left( x - E(X) \right) ^2 h(x) dx \\\\
& \geq c^2 \left\{ \int _{a} ^{-c + E(X)} h(x) dx + \int _{c + E(X)} ^{b} h(x) dx \right\} \\\\
&= c^2 P \left( |X - E(X)| \geq c \right) \\\\
P \left( |X - E(X)| \geq c \right) & \leq \frac{E \left( \left( X - E(X) \right) ^2 \right)}{c^2} = \frac{V(X)}{c^2}
\end{align}\]
参考:
[1] Wikipedia Pafnuty Chebyshev、https://en.wikipedia.org/wiki/Pafnuty_Chebyshev、2023年10月6日閲覧
[2] A.N.Kolmogorov 著、Nathan Morrison 英訳、FOUNDATIONS OF THE THEORY OF PROBABILITY、CHELSEA PUBLISHING COMPANY NEW YORK、1950年