確率統計キャンパス・ゼミ
- 28.4 時間
- 中心極限定理とても便利
- ポアソン過程(一定の確率で発生する事象)の間隔に注目するのが指数分布、回数に注目するのがポアソン分布
- 二項分布から正規分布への発展を理解した
- χ^2 分布、t 分布、F 分布を理解した。検定での使われ方も理解した
- 点推定と区間推定理解した
- 母平均と母分散の検定、母平均の差の検定、母分散の比の検定理解した
- 集合の定義
- 集合とは、ある一定の条件を満たすものの集まりのこと
- ただし、対象とするものが、その条件を満たすか否か、客観的に明らかなものの集まりでなければならない
- 各用語
- 試行
- 「コインを投げたり」、「サイコロを振ったり」といった、同様のことを繰り返すことが可能な行為
- 事象
- 試行の結果の「表が出たり」「偶数の目が出たり」する事柄
- この事象の中でも、これ以上簡単にならない 1 つ 1 つの基本的な事象を「根元事象」と呼ぶ
- 条件付き確率
- 事象 A が起こったという条件の下で、事象 B の起こる条件付き確率は P(B|A) = P(A∩B) / P(A)
- 事象 B が起こったという条件の下で、事象 A の起こる条件付き確率は P(A|B) = P(A∩B) / P(B)
- 確率の乗法定理
- P(A∩B) = P(A)・P(B|A)
- P(A∩B) = P(B)・P(A|B)
- ベイズの定理(p22)
- P(A|B) = P(A)・P(B|A) / (P(A)・P(B|A) + P(A~)・P(B|A~))
- ベイズの定理だと、何が原因で結果が起きたのかわからない場合に使える
- 上の式だと P(B|A) から P(A|B) を求められる(逆順の計算ができる)
- A を条件、B を結果と考えたときに、P(A|B) は B となった場合の A が原因である確率。これが、P(B|A) つまり A が起きた場合に B となる条件付き確率から計算できる
- 事象の独立
- 2 つの事象 A, B が独立であるための必要十分条件は、P(A∩B) = P(A)・P(B) <=> P(B|A) = P(B) <=> P(A|B) = P(A)
- 確率変数 X
- 確率変数 X: 全事象 U = {a, b, c, ...} の 1 つ 1 つの根元事象 a, b, c, ... に割り当てられた数値 x1, x2, x3, ... のいずれかをとる変数
- X = x1, x2, x3, ..., xn と置いた時、x1, x2, x3, ..., xn を確率変数 X の「実現値」という
- 確率関数 Pi の性質
- 1: 0 <= Pi <= 1
- 2: Σ(i=1->n) Pi = 1 (全確率)
- 3: P(0 <= X <= b) = Σ(a<=xi<=b) Pi
- 分布関数 F(x)
- 分布関数 F(x) = P(X <= x) = Σ(xi<=x) Pi (x: 連続型変数)
- F(x) を「累積分布関数」と呼ぶこともある
- 分布関数 F(x) の性質
- 1: a <= b の時、F(a) <= F(b)
- 2: F(-∞) = 0, F(∞) = 1
- 3: P(a < x <= b) = F(b) - F(a)
- 二項分布(離散型)
- 離散型確率変数 X = 0, 1, 2, ..., n について、確率関数 Pk が Pk = P(X = k) = nCk p^k・q^n-k (k = 0, 1, ..., n, 0 < p < 1, p + q = 1) で表される確率分布を「二項分布」と呼び、B(n, p) で表す
- 期待値・分散・標準偏差
- 離散型確率変数 X が確率関数 Pi (i = 1, 2, ..., n) の確率分布に従う時
- 期待値: μ = E[X] = Σ(i=1->n) xiPi = x1P1 + x2P2 + ... + xnPn
- 分散: V[X] = Σ(i=1->n) (xi - μ)^2・Pi = (x1 - μ)^2・P1 + (x2 - μ)^2・P2 + ... + (xn - μ)^2・Pn = E[X^2] - E[X]^2
- 標準偏差: σ = (V[X])^1/2
- k 次のモーメント
- 原点の周りの k 次のモーメント
- E[X^k] = Σ(i=1->n) xi^k・Pi = x1^k・P1 + x2^k・P2 + ... + xn^k・Pn
- μの周りの k 次のモーメント
- E[(X - μ)^k] = Σ(i=1->n) (xi - μ)^k・Pi = (x1 - μ)^k・P1 + (x2 - μ)^k・P2 + ... + (xn - μ)^k・Pn
- これで見ると、期待値μは原点の周りの 1 次のモーメントであり、分散 V[X] はμのまわりの 2 次のモーメントであるとわかる
- モーメント母関数 M(θ)
- 離散型確率変数 X と変数θに対して、モーメント母関数 M(θ) を、M(θ) = E[e^θX] と定義する
- 期待値・分散のモーメント母関数による表現
- 確率変数 X の期待値と分散は以下のように表せる
- 1: 期待値μ = E[X] = M'(0)
- 2: 分散 σ^2 = E[X^2] - E[X]^2 = M''(0) - M'(0)^2
- B(n, q) の期待値・分散
- 二項分布 B(n, q) の期待値 μ = np, 分散 σ^2 = npq である
- 連続型確率分布と確率密度 f(x)
- 連続型確率変数 X に対して P(a <= X <= b) = ∫(a->b) f(x) dx (a < b) となる関数 f(x) が存在するとき、f(x) を確率変数 X の「確率密度」といい、「確率変数 X は確率密度 f(x) の確率分布に従う」という
- 確率密度 f(x) の性質
- ∫(-∞->∞) f(x) dx = 1 (全確率)
- ∫(a->b) f(x) dx = P(a <= X <= b) = P(a < X <= b) = P(a <= X < b) = P(a < X < b)
- x = a, x = b となる確率は 0 なので、等号はあってもなくても構わない
- 分 布関数 F(x)
- 分布関数 F(x) = P(X <= x) = ∫(-∞->x) f(t) dt
- 分布関数 F(x) の性質
- 1: a <= b の時、F(a) <= F(b)
- 2: F(-∞) = 0, F(∞) = 1
- 3: P(a <= X <= b) = ∫(a->b) f(x) dx = F(b) - F(a)
- 期待値・分散・標準偏差
- 連続型確率変数 X が確率密度 f(x) の確率分布に従う時、以下のように表せる
- 期待値: μ = E[X] = ∫(-∞->∞) xf(x) dx
- 分散: σ^2 = V[X] = ∫(-∞->∞) (x - μ)^2・f(x) dx = E[X^2] - E[X]^2
- 標準偏差: σ = (V[X])^1/2
- モーメント母関数 M(θ)
- 確率密度 f(x) を持つ連続型確率変数 X と変数θに対して、モーメント母関数 M(θ) を、M(θ) = E[e^θX] = ∫(-∞->∞) (e^θX)・f(x) dx と定義する
- 離散型の時と同様に
- 1: 期待値μ = E[X] = M'(0)
- 2: 分散 σ^2 = V[X] = E[X^2] - E[X]^2 = M''(0) - M'(0)^2
- 指数分布(連続型)