Professional Documents
Culture Documents
横田 壽
1
目次
第 1 章 データの整理 3
1.1 度数分布表 (Frequency Tabulations) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 標本の散布度,相関関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3 相関表,回帰直線 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
第 2 章 確率 17
2.1 順列・組み合わせ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 確率の定義 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3 確率の公理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
第 3 章 確率変数 25
3.1 確率変数と確率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.2 2 次元確率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.3 確率変数の平均値と分散 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.4 多次元確率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
第 4 章 理論分布 33
4.1 2 項分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.2 ポワソン分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.3 正規分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.4 幾何分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.5 超幾何分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.6 指数分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.7 ガンマ分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
第 5 章 統計的推定法 43
5.1 統計量と標本分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.2 信頼区間 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.3 母比率の区間推定 (大標本の場合) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.4 母比率の区間推定 (小標本の場合) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.5 重要な標本分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2
5.6 χ 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.7 t 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.8 F 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2
第 6 章 統計的検定 57
6.1 統計的検定の考え方 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
6.2 母集団が正規分布で 2 標本の場合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
6.3 比率の検定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.4 適合度検定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
第 7 章 演習問題解答 75
3
第1章 データの整理
4 第 1 章 データの整理
例題 1.1
表 1.1: がん患者のヘモグロビン濃度
このデータを見ただけでは,どんな結果がでたのか分かりにくいので,これらのデータを整理して分かりや
すい表にすることを考えます.データの整理の方法として度数分布表 (frequency table) を用いることがよ
くありますので,度数分布表の作り方を学びます.
データの値を xi で表すとき,xi が現れる回数を度数 (frequency) といい,fi で表すと,
f1 + f2 + · · · + fk = n
ただし,n はデータの数です.これより,度数を表にしたものを作成することができます.
可能な値 度数
x1 f1
x2 f2
.. ..
. .
xk fk
合計 n
しかし,データの多くは小数点以下を切り捨てたり,四捨五入したりして得たものなので,xi という値で表
を作成する代わりに,a 以上 b 未満での度数という形で表を作成します.このとき,データを a 以上 b 未満と
1.1. 度数分布表 (Frequency Tabulations) 5
Fi = f1 + f2 + · · · + fi
表 1.2: 度数分布表
Sturges の式
データ数 n に対して階級数を決める一つの目安にスタージスの式があります.
6 第 1 章 データの整理
log10 n
階級数 = 1 + log10 2
log10 50
k =1+ = 1 + 3.32 log10 50 = 1 + 3.32(1.699) = 6.64 ≈ 7
log10 2
∑
n
T = x1 + x2 + · · · xn = xi
i=1
1∑
n
x1 + x2 + · · · xn T
x= = xi =
n n i=1 n
となるので,標本平均値は
1∑
k
x1 f1 + x2 f2 + · · · + xn fn
x= = xi fi
n n i=1
で与えられます.
変量の測定値を,大きさの順に並べたとき,中央の位置にくるものを,ミディアン (median) または中央値
n n
といいます.データの数 n が偶数のときは第 番目と第 + 1 番目の変量の平均が中央値.また,データの
2 2
n+1
数 n が奇数のときは第 番目の変量が中央値となります.
2
度数が最も大きい標本値 xi ,または階級値 mi をモード (mode) または最頻値といいます.
確認問題
• 例題 (1.1) の中央値を求めよ.
• 例題 ( 1.1) のモードを求めよ.
1.1. 度数分布表 (Frequency Tabulations) 7
演習問題 1.1
1. 次のデータについて,スタージェスの式をもちいて度数分布表・ヒストグラム・累積度数分布図を作成し
よう.また,平均値,最大値,最小値,中央値,最頻値を求めよう.
コンクリート円柱の引っ張りの強さ (g/cm2 )
320 380 340 410 380 340 360 350 320 370
350 340 350 360 370 350 380 370 300 420
370 390 390 440 330 390 330 360 400 370
320 350 360 340 340 350 350 390 380 340
400 360 350 390 400 350 360 340 370 420
420 400 350 370 330 320 390 380 400 370
390 330 360 380 350 330 360 300 360 360
360 390 350 370 370 350 390 370 370 340
370 400 360 350 380 380 360 340 330 370
340 360 390 400 370 410 360 400 340 360
8 第 1 章 データの整理
1.2 標本の散布度,相関関係
散布度 (dispersion)
5 点満点のテストを行なったところ次のような度数分布表を得ました.
階級 fi fi /n Fi Fi /n
0 2 0.02 2 0.02
1 13 0.13 15 0.15
2 33 0.33 48 0.48
3 35 0.35 83 0.83
4 16 0.16 99 0.99
5 1 0.01 100 1.00
また,代表値として次の表を得ました.
∑
標本数 T x̄ fi x2i s2 s
100 253 2.53 741 1.01 1.00
この表の s2 と s について説明します.
散布度 : データが平均のまわりに集中して分布するか,平均のまわりから散らばって分布するかの程度を表
わすのが,散布度です.
度数分布表において,各階級数 xi (i = 1, 2, . . . , k) に対する度数を fi とするとき,変量 x の平均 x からの偏
差の平方の平均:
となっています.この 2 つの式の違いは,前者は観測対象の全ての観測値が求められた場合に用います.後者
はそれ以外のときに用います.
1.2. 標本の散布度,相関関係 9
ここで標本分散を簡単に計算する実用的な方法として次の簡便計算法があります.
1∑ 2
n
s2 = x − (x)2
n i=1 i
例題 1.2
上の式を導きなさい.
解答
1∑ 1∑ 2
n n
s2 = (xi − x)2 = (x − 2xi x + x2 )
n i=1 n i=1 i
( n ) ( n )
1 ∑ 2 ∑ ∑ ∑
n n
1
= x − 2x xi + x2 = x2 − 2xx + x2
n i=1 i i=1 i=1
n i=1 i
1∑ 2
n
= x − x2
n i=1 i
標本標準偏差は平均値のまわりのデータの散らばりの大きさを表す量ですが,標本標準偏差が 10 点である
といっても平均点が 30 点のときと,60 点のときでは違いがあることが分かります.この違いを表す量として,
s
変動係数とよばれるものがあります.変動係数はデータの平均値 x で標準偏差 s を割った割合 x で表します.
したがって,変動係数は平均値に対する相対的な散らばりの大きさを表します.
例題 1.3
解答 2 つの異なるものを比較するには,共に同じ土俵にもってこなくてはなりません.その方法として標準化
とよばれるものがあります.
xi − x̄
zi =
s
とおくと,{zi } の平均は 0 に分散 s2 は 1 になります.そこで,英語の成績と数学の成績の標準化を行うと,
75 − 67
zenglish = = 0.94
8.5
68 − 53
zmath = = 1.19
12.6
10 第 1 章 データの整理
となり,A 君のクラスでの成績は数学の方が英語より上であるといえます.
相関関係
2 次元データの分布の特徴は 2 つの変数の平均値と分散だけでは表わすことが困難です.そこで (x, y) の n
組のデータを
(x1 , y1 ), (x2 , y2 ), · · · , (xn , yn )
1∑ 1∑
n n
sxy = (xi − x)(yi − y) = xi yi − xy
n i=1 n i=1
sxy
r=
sx sy
ここで sx は変量 x の標準偏差,sy は変量 y の標準偏差を表わします.
確認問題
67 54 54 66 56 65 46 35 45 45
83 72 54 58 47 60 43 82 76 92
演習問題 1.2
1. 次のデータについて,共分散,相関係数を求めよう.
1.2. 標本の散布度,相関関係 11
表 1.3: 二酸化硫黄と二酸化窒素の濃度
1.3 相関表,回帰直線
相関表
ある場所で 1 時間おきに二酸化硫黄と二酸化窒素の濃度を測定しました.このとき,二酸化硫黄と二酸化窒
素の濃度の間にはどんな関係があるのか調べるために準備をします.
ある時刻での二酸化硫黄の濃度を xi , 二酸化窒素の濃度を yi とし,x 軸に二酸化硫黄の濃度を y 軸に二酸化
窒素の濃度をとって,座標 (xi , yi ) を持つ点を図示したものを相関図 (correration diagram) といいます.
xi が増加するとき,yi も増加する傾向があるとき,xi と yi は正の相関 (positive correration) があると
いいます.これに反し,xi が増加するとき,yi が減少する傾向があるとき,xi と yi は負の相関 (negative
correration) があるといいます.
相関表
相関図ではデータの数が非常に多い場合には,その図示が困難となる場合があります.そのような場合には,
2 つの変量を同時に考えた度数分布表として表わすと便利です.このような表を相関表といいます.
回帰直線
二酸化硫黄と二酸化窒素の関係のように,変量 x の値 x1 , x2 , . . . , xn に,変量 y の値 y1 , y2 , . . . , yn がそれぞ
れ対応していると仮定します.このとき,平面上の n 個の点:
y = ax + b
を求めることを考えます,
もし回帰直線が求められていれば,xi に対する y の値 (予測値 ŷi ) は
ŷi = axi + b
ここで,
∑
n ∑
n
d2i = (yi − axi − b)2
i=1 i=1
1.3. 相関表,回帰直線 13
∑
n
F (a, b) = (yi − axi − b)2
i=1
∂F ∑
n ∑
n
= [2(yi − axi − b)(−xi )] = −2 (yi − axi − b)xi
∂a i=1 i=1
∂F ∑n ∑
n
= [2(yi − axi − b)(−1)] = −2 (yi − axi − b)
∂b i=1 i=1
この式を書き直すと正規方程式
∑
n ∑
n ∑
n
xi yi − a x2i − b xi = 0
i=1 i=1 i=1
∑
n ∑
n
yi − a xi − bn = 0
i=1 i=1
Px i Pyi
を得ます.ここで,x = i=1
n ,y = i=1
n であることに注意すると,上の2式は次のように書きなおせます.
∑
n ∑
n
xi y i − a x2i − bnx = 0
i=1 i=1
ny − anx − bn = 0
第2式から,y − ax − b = 0 となるので,これを第1式に代入すると,
∑
n ∑
n
xi y i − a x2i − (y − ax)nx = 0
i=1 i=1
( n )
∑
n ∑
xi yi − nxy = a x2i − nx 2
i=1 i=1
となります.ここで,両辺を n で割ると,
( )
1∑ 1∑ 2
n n
xi yi − xy = a x − x2
n i=1 n i=1 i
sxy = as2x
14 第 1 章 データの整理
となり,求める a は
sxy
a=
as2x
となります.最後に,y − ax − b = 0 より,b を求めると,
sxy
b = y − ax = y − x
as2x
これより,x 上の y の回帰直線
sxy
y−y = (x − x)
s2x
が求まります.ここまでを整理すると,
n 個のデータ {(xi , yi ) (i = 1, 2, . . . , n) について,y の x への回帰係数は
sxy nTxy − Tx Ty
ayx = = ∑ 2
2
sx n xi − Tx2
y の x への回帰直線 l の方程式は
y − y = axx (x − x)
x1 : 注入速度
x2 : 材料の粒度
x3 : 水分量
y = b0 + b1 x1 + b2 x2 + b3 x3
の形をとり,この式を求めることを重回帰分析といいます.
演習問題 1.3
1. 次のデータ から得られる相関表より回帰直線を求めよう.
1.3. 相関表,回帰直線 15
表 1.4: 二酸化硫黄と二酸化窒素の濃度
第2章 確率
18 第2章 確率
2.1 順列・組み合わせ
ある事柄が何通りの起こり方があるかを考えるとき,その起こり方の個数を場合の数という.
番号のついた n 個の異なったものをある規則のもとに順に並べたものを順列 (permutation) といい,順列の
総数を順列の数という.
n!
n Pr = n(n − 1)(n − 2) · · · (n − r + 1) =
(n − r)!
n Πr = nr
(n − 1)!
n!
n Cr =
r!(n − r)!
演習問題 2.1
(a) すべての数字が異なる場合
(b) 5 の倍数
(c) 同じ数字が重複してもよい場合
2. 1 から 10 までの番号のついたカードから 6 枚を取り出すとき,次のような場合の数を求めよう.
(a) すべての場合
(b) 1 と 2 のカードを含む場合
3. 1 枚の硬貨を 5 回投げるとき,次の場合は何通りあるか求めよう.
(b) 起こりえるすべての場合
4. a, b, c, d, e, f の文字を一列に並べるのに次の場合は何通りあるか求めよう.
(a) a, b が隣あう場合
(b) a, b が隣合わない場合
(c) a, b が両端にくる場合
( 8
)
5. a, a, a, a, b, b, c, d の 8 個の文字を並べる順列の総数は 4,2,1,1 で与えられることを示せ.
20 第2章 確率
2.2 確率の定義
さいころを投げてどの目が出るか,1枚の硬貨を投げて表がでるか裏が出るかは,実際に投げてみないと
分からない.このように,ほぼ一定の条件のもとで,繰り返し起こる現象を観察したり実験することを試行
(experiment) という.試行によって起こる結果 (outcome) は一般に多数あるが,その起こる事柄を事象 (event)
という.また,試行によって起こりえるすべての事象の集まりを標本空間 (sample space) といい,一般に Ω
で表す.事象のうち,これ以上簡単なものに分解できないような事象を根元事象という.
例 2.1 さいころを投げるという試行を行う.このとき,根元事象は
1, 2, 3, 4, 5, 6
演習問題 2.2
1. 1 個のさいころを 6 回投げるとき,次の確率を求めよう.
(a) 全部が白である場合.
(c) 白が 2 個以内.
2.2. 確率の定義 21
(d) 白が 2 個,赤が 2 個.
(e) 白,赤,黒がともに含まれている場合
3. 1 から 10 までの番号のついたカードがある.これらのカードを勝手に 1 列に並べるとき,次の確率を求め
よう.
(a) 1 から 10 までがその順に並ぶ場合
(b) 円板が正方形の辺にかかる.
(a) 2 個とも白玉である確率
(b) 1 個だけ白玉である確率
2.3 確率の公理
事象 A と事象 B とが同じであるとき,A = B と書く.事象 A が事象 B に含まれているとき,A ⊂ B と書く.
事象の演算について,集合の場合と同様に次の関係式が成り立つ.
Ω = Ω ∪ ϕ, ϕ = Ω ∩ ϕ
2. 任意の事象 A に対して
A ∩ A = ϕ, A ∪ A = Ω
3. 任意の事象 A, B, C に対して
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
(A ∪ B) = A ∩ B, (A ∩ B) = A ∪ B
(A ∩ B) ∩ (A ∩ B) = ϕ, A = (A ∩ B) ∪ (A ∪ B)
1.
0 ≤ P (A) ≤ 1
2.
P (Ω) = 1, P (ϕ) = 0
2.3. 確率の公理 23
3. 事象の列 A1 , A2 , . . . , Ai . . . のいずれの2つも互いに排反であれば,
∞
∑
P (∪∞
i=1 Ai = P (Ai )
i=1
が成り立つ.この性質を確率に関する完全加法性という.
P (A ∩ B)
P (B|A) =
P (A)
A1 ∪ A2 ∪ · · · ∪ An = Ω
ならば,任意の事象 B に対して
B = B ∩ Ω = (B ∩ A1 ) ∪ (B ∩ A2 ∪ · · · ∪ (B ∩ An )
と表せる.よって,
P (B) = P (B ∩ A1 ) + P (B ∩ A2 ) + · · · + P (B ∩ An )
ここで,条件付き確率より,P (B ∩ Ai ) = P (Ai )P (B|Ai ) となるので,
演習問題 2.3
enshu:2-3-2 ある患者がある種の症状を訴えてきた.医師の経験から,同じ年齢層の人がその症状を訴えると
き,約 5%の人がガンであることを知っている.一方,ある精密検査によって真のガン患者に対しては 85%の
陽性反応を示し,ガン患者でない人にも 5%の陽性反応を示す.もしある患者がその精密検査の結果陽性反応
を示した場合,その患者がガン患者である確率を求めよう.
3. 次の関係を示そう.
(a) P (A ∪ B) = P (A ∩ B)
(b) P (A ∩ B) = P (A ∪ B)
第3章 確率変数
26 第3章 確率変数
3.1 確率変数と確率分布
• 確率変数 x1 , x2 , . . . , xn なる n 個の値をとる変数 X に対して,X = xi なる確率 pi が与えられていると
き,X を確率変数という.
確率変数 X のとる値が有限個または,無限個であっても自然数で番号が付けられる場合,確率変数 X は離
散型であるという.また,確率変数 X がある区間内の全ての実数を取り得る場合,連続型であるという.
離散型の場合
確率変数 X のとる値を x1 , x2 , . . . , xn とし,各事象 (X = xi ) の確率を p1 , p2 , . . . , pn とするとき,
∑
P (X = xi ) = pi (i = 1, 2, . . . , n) pi = 1, (pi ≥ 0)
で表される.これより,X の確率分布 f は
X の値 xi x1 x2 ··· xn
P (X = xi ) = pi = f (xi ) p1 p2 ··· pn
∑
r
F (xr ) = P (X ≤ xr ) = p1 + p2 + · · · + pr = pi
i=1
1. 0 ≤ pi = f (xi ) ≤ 1 (i = 1, 2, . . . , n)
2. F (xn ) = P (X ≤ xn ) = p1 + p2 + · · · + pn = 1
連続型の場合
確率変数 X が連続的な値をとるとき,事象 {X ≤ x} の確率が連続関数 F (x) によって,
∫ x
F (x) = P (X ≤ x) = f (x)dx
−∞
演習問題 3.1
3.1. 確率変数と確率分布 27
4. 確率密度が
0, x ≤ 0
f (x) = 6x(1 − x) 0 < x ≤ 1
0 x>1
で与えられている.
5. 関数 {
e−x ,x ≥ 0
f (x) =
0 ,x ≤ 0
が与えられている.
3.2 2 次元確率分布
離散型の場合,2つの確率変数の取り得る値をそれぞれ
x1 , x2 , . . . , xk
y 1 , y2 , . . . , y l
とし,
Pr (X = xi ) = pi
Pr (Y = yj ) = qj
とする。ここで,
「X = xi かつ Y = yj 」という事象の確率を
Pr (X = xi , Y = yj ) = pij , i = 1, . . . , k, j = 1, . . . , l
で表す。このとき, ∑l
∑j=1 pij = pi ,
k
i=1 pij = qj
∑k ∑l ∑k ∑l
i=1 j=1 pij = i=1 pi = j=1 qi = 1
となる。このような分布を2次元確率分布という。
演習問題 3.1
(a) 和 X + Y + Z の確率分布を求めよ.
(b) 和 X + Y + Z の分布関数を求めよ.
3.3. 確率変数の平均値と分散 29
3.3 確率変数の平均値と分散
確率変数 X に対して,次の式で定義される値 E(X) を X の平均値または期待値 (Expectation) といい,
V (X) を X の分散という。
離散型の場合 pi = P (X = i)
∑k
1. E(X) = x1 p1 + x2 p2 + · · · + xk pk = i=1 xi p i
∑k
2. V (X) = (x1 − E(X))2 p1 + (x2 − E(X))2 p2 + · · · + (xk − E(X))2 pk = i=1 (xi − E(X))2 pi
∫∞
連続型の場合 P (X ≤ x) = F (x) = −∞ f (x)dx
∫∞
1. E(X) = −∞ xf (x)dx
∫∞
2. V (X) = −∞ (x − E(x))2 f (x)dx
aX + b の期待値と分散
∫ ∞ ∫ ∞ ∫ ∞
E(aX + b) = (ax + b)f (x)dx = a xf (x)dx + b f (x)dx
−∞ −∞ −∞
∫ ∞
= aE(X) + b ( f (x)dx = 1 に注意)
−∞
∫ ∞ ∫ ∞
V (aX + b) = [(ax + b) − (aE(x) + b)] f (x)dx =
2
a2 (x − E(x))2 f (x)dx
−∞ −∞
2
= a V (X)
演習問題 3.2
{
1 − |x| (−1 ≤ x ≤ 1)
1. f (x) =
0 (その他)
のとき次の問いに答えよう.
(c) Pr (− 12 ≤ X ≤ 12 ) を求めよう.
(a) X の確率分布を求めよう.
(b) X の平均と標準偏差を求めよう.
3. Bernoulli の定理を利用して,次の確率を求めよう.
を満たす確率.
をみたす確率.
3.4 多次元確率分布
演習問題 3.3
2. 確率変数 X の確率密度が次の式 {
2x 0 ≤ x < 1
f (x) =
0 その他
で与えられるとき,次の確率変数 Y, Z の確率密度,平均値,分散を求めよ.
(a) Y = 2X + 3
(b) Z = X 2
3. 2 つのさいころを投げて出た目を確率変数 X, Y とする.
(a) 積 XY の期待値を求めよ.
(b) 積 XY の分散を求めよ.
33
第4章 理論分布
34 第4章 理論分布
4.1 2 項分布
次の 1∼3 を満たす試行をベルヌーイ試行という.
1. 各試行において,その事象が発生するか否かのみを問題にする.
2. 各試行は統計的に独立.
3. 対象とする事象が発生する確率は,各試行を通じて一定.
演習問題 4.1
(a) 8 匹全部が一定期間以上生存する確率を求めよ.
4.2 ポワソン分布
次の1∼5の条件を満たすものをポワソン過程という。
1. 事象はいかなる時点でもランダムに発生しうる。
2. 与えられた時間区間での事象の発生は,それと重複しない他の区間に対して独立である。
4. 微小時間 ∆t の間に事象が2回以上発生する確率は無視できる。
5. 時間 t の間に当該事象が発生する平均発生回数 λ がおおむね5以下である。
X をポワソン過程における事象の発生回数とすると,
λr −λ
Pr (X = r) = e
r!
演習問題 4.2
4.3 正規分布
確率変数 X の確率密度関数が
[ ]
1 (x − µ)2
g(x) = √ EXP − , −∞ < x < ∞
2πσ 2σ 2
の値は標準正規分布表として与えられている。
標準化
確率変数 X の平均 E(X) を 0 に,分散 V (X) を 1 に直すことを標準化といいます.
標準化の方法
X − E(X)
Z= √
V (X)
とおくと
E(Z) = 0, V (Z) = 1
になります.
一様分布
確率変数 X の確率密度関数が
{
1
b−a , a<x<b
f (x) =
0, otherwise
よって,15 分以上待つ確率は,
∫ 20 ∫ 20
1 1
Pr (15 ≤ X ≤ 20) = f (x)dx = dx =
15 15 20 4
正規分布の応用
4.3. 正規分布 37
X1 + X2 + · · · + Xn σ2
X̄ = ∼ N (µ, )
n n
2
X̄ = X1 +X2 +···+Xn
n は近似的に ∼ N (µ, σn ) に従う.
演習問題 4.3
(a) Pr (X ≤ 160)
4. 2 項分布,ポワソン分布,正規分布について,次のことがいえます.
X ∼ B(n, p) のとき, {
Po (µ) , np ≤ 5
X∼ で近似される
N (µ, σ 2 ) , np > 5
このことを用いて次の質問に答えよう.
4.4 幾何分布
繰返し独立に試行を行うとき,注目している事象が初めて起こる直前までの試行回数を X とし,p を注目し
ている事象が起こる確率とすると,注目している事象が i + 1 回目に起こる確率は,
Pr (X = i) = (1 − p)i p
X ∼ Ge (p)
と表す。また,
q q
E(X) = , V (X) = 2
p p
で与えられる。
期待値 E(X) を求める一つの方法に,母関数 (generating function) を用いる方法がある。
離散型の場合
∑∞
η(t) = E(tX ) = k=0 tk P (X = k) とおくと,η ′ (t) = E(XtX−1 ) より,t = 1 のとき,η(1) = E(X) とな
る。よって,期待値は η(t) が求まれば微分することにより求めることができる。
連続型の場合
∫∞
ϕ(t) = E(etX ) = −∞
etx dF (x) とおき,etx を整級数で置き換えると,
∫ ∞
ϕ(t) = etx dF (x)
−∞
∫ ∞ ∑
k
(tx)k
= dF (x)
−∞ k=0 k!
∑
k ∫ ∞
tk
= xk dF (x)
0
k! −∞
∑
k k
t
= E(X)
0
k!
これより,
∑
k
ktk−1
ϕ′ (t) = E(X)
1
k!
ここで,t = 0 とおくと,
ϕ′ (0) = E(X)
となる。
演習問題 4.4
1.
4.4. 幾何分布 39
(b) 勝率 3 割のチームは平均して何試合目にはじめて勝つか求めよ.
40 第4章 理論分布
4.5 超幾何分布
壺のなかに白玉が N1 個,黒玉が N2 個入っている。この中から 1 個ずつ,元に戻さない(非復元抽出) で n
個の玉を取り出すときの白玉の個数を X とする。白玉の数が i 個の確率は
(N1 )( N2 )
i
Pr (X = i) = (Nn−i
)
n
となる。このとき,確率変数 X は超幾何分布に従うといい,
X ∼ Hg (N, N1 , n)
と表す。また,
nN1 nN1 n − N1 N − n
E(X) = , V (X) = · ·
N N N N −1
演習問題 4.5
4.6 指数分布
確率変数 X の確率密度関数が
{
λ−λx , 0 < x < ∞
f (x) =
0, −∞ < x < 0
で与えられる.
∫ ∫ ( )
∞ ∞
−λx −λx u=x dv = e−λx dx
E(X) = x(λe )dx = λ xe dx
0 0 du = dx v = − λ1 e−λx
[ ]∞
1 −λx 1 −λx
= λ − xe + 2e
λ λ 0
1
=
λ
1
これより,期待値 E(X) = λ となる.
分散は母関数を用いて求める.
∫ ∞
Φ(t) = E(etX ) = etx λe−λx dx
−∞
∫ ∞
(t−λ)x
= λe dx
−∞
1 (t−λ)x ∞
= λ e |−∞
t−λ
λ
= −
t−λ
これより,
λ λ 1
Φ′ (t) = , Φ′ (0) = 2 =
(t − λ) 2 λ λ
演習問題 4.6
4.7 ガンマ分布
確率変数 X の確率密度関数が
{
α−1 − β
x
1
Γ(α)β α x e , 0<x<∞
f (x) =
0, −∞ < x < 0
で与えられます.
ガンマ関数の特徴
∫ ∞
Γ(1) = e−x dx = 1
0
演習問題 4.7
−(x−2)
f (x) = ce , x≥3
0, その他
(a) 定数 c の値を定めよ.
第5章 統計的推定法
44 第 5 章 統計的推定法
5.1 統計量と標本分布
日本の小学 6 年生の身長を調査するとします.このとき,対象全体についての調査を全数調査といいます.
しかし,全数調査は労力や経費の点から不可能なことがよくあります.そこで,全数調査に代わるものとして,
対象全体から何らかの方法で一部の対象を選び出し調査を行い,それにより対象全体についての推測をする方
法を標本調査といいます.このとき,調査対象となる小学 6 年生の身長の集まりを母集団 (population) とい
います.また,調査のために選び出された 6 年生の身長の集まりを標本 (sample) といいます.
標本抽出
日本の小学 6 年生を Π とし,小学 6 年生の各人の身長を X とすると,母集団は (Π, X) と表せます.この母
集団から取り出した n 個の要素の組 (x1 , x2 , . . . , xn ) を大きさ n の標本といいます.このとき,個々の xi は X
と同じ分布をする確率変数 Xi が実現した数値でなければなりません.そこで,確率変数の組 (X1 , X2 , . . . , Xn )
を大きさ n の確率標本変数といいます.確率標本変数 (X1 , X2 , . . . , Xn ) に要求される数学的条件は,各 Xi が
母集団 (Π, X) の X と同じ分布をする独立な確率変数であることです.では,実際に標本を選ぶときには,ど
のようにしたらよいのでしょうか.それには,個々の標本が全く偶然に,つまり同じ確率で現れるように選ば
れる必要があります.例えば,6 人から 1 人を選ぶには,正しいサイコロを振って決めるとか,52 人から 2 人
を選ぶとき,トランプのカードに各人を対応させて,よく切ったあと 2 枚を選ぶなどがあります.このように
して,標本を選ぶことを無作為抽出またはランダム抽出といいます.そして,このようにして選ばれた標本を
確率標本といいます.
この母集団から無作為に抽出された標本を
X1 , X 2 , . . . , X n
とします.標本確率変数 Xi (i = 1, 2, . . . , n) は互いに独立に母集団分布に従います.よって,
E(Xi ) = µ, V (Xi ) = σ 2
となります.ここで,標本 X1 , X2 , . . . , Xn を用いて母平均と母分散をすいてすることを考えます.まず,素朴
に考えて,X1 , X2 , . . . , Xn を n 個のデータの集まりとして,その平均と分散を求めます.すると,
1∑
n
標本平均 X= Xi
n i=1
1∑
n
標本分散 S2 = (Xi − X)2
n i=1
例題 5.1
標本平均の分散と標準偏差を求めよう.
5.1. 統計量と標本分布 45
解答
2
V (X) = E(X ) − E(X)2
1 ∑ 2
n
= E( ( X ) − µ2
n i=1 i
1
= E(X 2 + · · · + Xn2 + 2(X1 X2 + · · · + Xn−1 Xn )) − µ2
n2 1
1 ∑ ∑
n
= E(X 2
i ) + 2 E(Xi Xj ) − µ2
n2 i=1
1≤i,j≤n
( )
1 ∑ 2
n
2 n 2 σ2
= (σ + µ 2
) + µ − µ 2
=
n2 i=1 n2 2 n
したがって,標本平均の標準偏差は √σ
n
定理 5.1 (チェビシェフの定理)
λσ 1
P (|X − µ| < √ ) ≥ 1 − 2
n λ
よって, √λn = 1
5 で
σ 25
)≥1− ≥ 0.9
P (|X − µ| <
5 n
とすればよい.これから,n ≥ 250 とすればよいことが分かる.
統計的推定
母集団から無作為に抽出された標本
X 1 , X2 , X3 , . . . , X n
から,標本平均
1
X= [X1 + X2 + X3 + · · · + Xn ]
n
46 第 5 章 統計的推定法
標本分散
1
[(X1 − X)2 + (X2 − X)2 + · · · + (Xn − X)2
S2 =
n
といった標本の統計量の値 (統計値) を用いて,母集団の分布に含まれる母数 (母平均,母分散) の値を推定す
ることを統計的推定といいます.
点推定
点推定は母数を 1 個の数値で定めようとする方法のことです.全数調査ができれば,母集団の母数は簡単に
求めることができます.しかし,大事なことは,全数調査ができないときに,標本を通して母数の情報を得る
ことです.
母数を θ とし,これに対し大きさ n の標本変量 {x1 , x2 , . . . , xn } の統計量 T (x1 , x2 , . . . , xn ) を考えます.こ
の関数に抽出された標本値 (X1 , X2 , . . . , Xn ) を代入した値 θ̂ = T (X1 , X2 , . . . , Xn ) でもって,θ の値であると
推定することを,θ の点推定という.
不変推定量
ある推定値 θ̂ = T (X1 , X2 , . . . , Xn ) について,
のとき,θ̂ を θ の不偏推定量という.
母集団 N (µ, σ 2 ) において,次の統計量は不偏推定量である.
1∑ 1 ∑
n n
X̄ = Xi , U 2 = (Xi − X̄)2
n n=1 n − 1 i=1
この意味で,U 2 を不偏分散という.
例題 5.3
X̄ は不偏推定量であることを示そう.
解 E(X + Y ) = E(X) + E(Y ) より,
したがって,E(X̄) = µ.
1∑
n
n−1 2
S2 = (Xi − X̄)2 = U
n i=1 n
演習問題 5.1
1. 次のデータの不偏分散を求めよう.また,標準偏差を求めよう.
110, 121, 133, 124, 126, 118, 112, 125, 131, 120(cm)
5.2. 信頼区間 47
5.2 信頼区間
区間推定
母数 θ がある区間 [θ1 , θ2 ] に入るだろうと推定するのが区間推定です.詳しくいうと,母数 θ を推定するため
に,母集団から無作為に抽出された標本から 2 つの統計値 θ1 , θ2 を定める.このとき,あらかじめ指定された
小さな確率 α (0 < α < 1) に対して,常に
σ2
E(X) = µ, V (X) =
n
より
σ2
X ∼ N (µ, )
n
と表せます.また,
1∑
n
n−1 2
S2 = (Xi − X)2 の期待値 E(S 2 ) = σ
n i=1 n
より
n
S′ = S 2 の期待値 E(S ′ ) = σ 2
2 2
n−1
と表せます.
母平均 µ の区間推定 (σ 2 既知)
ここでは α = 0.05 つまり,95%信頼区間を推定します.まず,
σ2
X ∼ N (µ, )
n
より標準化を行なうと,
X̄ − µ
Z=√ ∼ N (0, 1)
σ 2 /n
これより,
( )
Pr |Z| ≤ z α2 = 1 − α = 0.95
ここで,z α2 は,
α
Pr (Z ≥ z α2 ) =
2
48 第 5 章 統計的推定法
z α2 = 1.96
となります.よって求める信頼区間は次の不等式を満たします.
X̄ − µ
|Z| = | √ | ≤ z α2
σ 2 /n
この不等式を µ について解くと √ √
σ2 σ2
X − z α2 ≤ µ ≤ X + z α2
n n
を得ます.これが母平均 µ の信頼区間となります.
図 5.1: 正規分布
X̄ ∼ N (µ, σ 2 /5)
となる.ここで,X̄ を求めると,
1 132
X̄ = [28 + 24 + 31 + 27 + 22] = = 26.4
5 5
標準化を行なうと,
X̄ − µ
Z=√ ∼ N (0, 1)
σ 2 /5
となる.95%信頼区間より,Pr (|Z| ≤ z α2 ) = 0.95. また,z 0.05 = 1.96. したがって,
2
√ √
σ2 σ2
X̄ − z α ≤ µ ≤ X̄ + z α2
2
5 5
5.2. 信頼区間 49
√ √
26.4 − 1.96 6.25/5 ≤ µ ≤ 26.4 + 1.96 6.25/5
24.21 ≤ µ ≤ 28.59
次に,母集団が正規分布に従うことは分かっているが母分散 σ 2 が不明である場合を考えます.
平均値の区間推定 (σ 2 未知)
ここでは α = 0.05 つまり,95%信頼区間を推定します.この場合,2 つの母数 µ, σ 2 が必要となりますが,σ 2
が未知なので,σ 2 を推定する不偏分散 S ′ を σ 2 の代わりに用います.すると,母分散に無関係に
2
X̄ − µ
T =√
S ′ 2 /n
は,自由度 n − 1 の t 分布に従うことが知られています.これより,
Pr (|T | ≤ tn−1,α/2 )) = 1 − α
となります.ここで,tn−1,α/2 は,
α
Pr (T ≥ tn−1,α/2 ) =
2
を満たす点である.このとき,tn−1,α/2 を t 分布表の両側確率で求めると,α = 0.05,n = 10 のとき,t9,0.05/2
は
t9,0.05/2 = 2.26
よって求める信頼区間は次の不等式を満たします.
X̄ − µ
|√ | ≤ tn−1,α/2
S ′ 2 /n
この不等式を µ について解くと
√ √
S′2 S′2
X − tn−1,α/2 ≤ µ ≤ X + tn−1,α/2
n n
を得ます.
演習問題 5.2
X
とします.このとき,X = X1 + · · · + Xn とすると,X は標本中 A であるものの個数を表す統計量で, は
n
事象 A の標本比率といいます.
X
は母比率 p の不偏推定量である
n
したがって, ¯ ¯
¯ ¯
¯ p̂ − p ¯
P ¯¯ √ ¯ ≤ zα = 1 − α
¯
¯ p(1−p) ¯
2
が成り立ちます.この式を書き直すと
√ √
p(1 − p) p(1 − p)
p̂ − z α ≤ p ≤ p + z α2
2
n n
この両辺は母数 p を含んでいるが,n が非常に大きいときには p̂ で近似できるので,母比率 p の信頼度 100(1−α)%
の信頼区間は
( √ √ )
p̂(1 − p̂) p̂(1 − p̂)
p̂ − z α2 , p̂ + z α2
n n
となります.
演習問題 5.3
1 サイコロを 600 回投げたところ,1 の目が 108 回出たという.1 の目が出る母比率 p を信頼度 95% で区間
推定せよ.
5.4. 母比率の区間推定 (小標本の場合) 51
演習問題 5.4
5.5 重要な標本分布
第 2 章で,確率分布の基礎となる 2 項分布と正規分布の話をしました.ここでは,まず,正規分布の性質に
ついて考えます.
正規分布の加法性
確率変数 X, Y が独立で,それぞれ正規分布 N (µ1 , σ12 ), N (µ2 , σ22 ) に従うとき,和 aX + bY は正規分布
に従う.
X1 + X2 + · · · + Xn σ2
X= ∼ N (µ, )
n n
証明 正規分布の加法性より,
X1 + X2 + · · · + Xn ∼ N (nµ, nσ 2 )
したがって,
1 nσ 2 σ2
X= (X1 + X2 + · · · + Xn ) ∼ N (µ, 2 ) = N (µ, )
n n n
例題 5.5
120.5 − 120
P (X > 120.5) = P (Z > 4.5 ) = P (Z > 0.9428)
√
50
= 0.5 − P (0 < Z < 0.9528) = 0.5 − 0.32710 ≈ 0.173
次に,Xi が正規分布に従わない場合を考える.
5.6 χ2 分布
χ2 分布は1つの自然数 n を含む連続型分布で,χ2 (n) と表し n をその自由度という。χ2 分布の密度関数
fn (x) は次の式で与えられる。
n
1
x 2 −1 e− 2 x
n 1
x>0
2 2 Γ( n )
fn (x) = 2
0 x≤0
ここで,ガンマ関数 Γ(x) は ∫ ∞
Γ(x) = tx−1 e−t dt (x > 0)
0
で定義される。
χ2 分布の名前は次の性質から来ている。
は自由度 n の χ2 分布に従う。その期待値と分散は
E(χ2n ) = n, V (χ2n ) = 2n
定理 5.5 (χ2 分布の加法性) χ2n , χ2m がそれぞれ自由度 n,m の χ2 分布に従い,互いに独立ならば,χ2 = χ2n +χ2m
は自由度 n + m の χ2 分布に従う。
標本分散 S 2 に関して,次の定理がある。
1 ∑
n
nS 2
Y = (X i − X̄)2
=
σ 2 i=1 σ2
は自由度が n − 1 の χ2 分布に従って分布する。
20S 2 ∑ 20
Y = = (Xi − X̄)2
1 i=1
は自由度 19 の χ2 分布に従う。したがって,
ここで,χ2 分布表を用いると,P (χ219 > 27.20) = 0.10 で P (χ219 > 30.14) = 0.05 より,
28.5 − 27.20
P (χ219 ≥ 28.5) = 0.05 + (0.10 − 0.05) ≈ 0.07
30.14 − 27.20
5.7. t 分布 55
5.7 t 分布
定義 5.1 確率密度関数 fn (x) が
γ( n+1 ) x2 n+1
fn (x) = √ 2 n (1 + )− 2 (n ≥ 1)
nπγ( 2 ) n
1 ∑
n
U 2 = S′ =
2
(Xi − X)2
n − 1 i=1
とし,正の平方根を U とすると,
X −µ
T = √
U/ n
は自由度 n − 1 の t 分布に従う。
Z
Tn = √
χ2m /n
は自由度 n の t 分布に従う。
Pr (Tn ≤ c) ≈ Pr (Z ≤ c)
5.8 F 分布
定義 5.2 確率密度関数 fm,n (x) が
m −1
γ( m+n
2 )
m n
n m 2 n2
x2
(x > 0)
γ( m
2 )γ( 2 )
m+n
fm,n (x) = (mx+n) 2
0,
となる。
このとき,
U12 /σ12 σ2 U 2
F = 2 2 = 22 12 ∼ F (n1 − 1, n2 − 1)
U2 /σ2 σ1 U2
例題 5.6
Fnn21 (1 − α) を求めるには,次の公式を用いる
1
Fnn21 (1 − α) =
Fnn12 (α)
例題 5.7
5
F11 (1 − 0.05) を求めよ.
解
1 1
5
F11 (1 − 0.05) = = = 0.32
F511 (0.05) 3.10
57
第6章 統計的検定
58 第 6 章 統計的検定
6.1 統計的検定の考え方
超心理学では透視実験に ESP カードを用います.カードは 5 種類からなっています.そこで 1 枚のカードを
引いて裏向きに置いて,このカードの種類をあてさせます.カードを元に戻し同じ実験を 5 回繰り返したとこ
ろ,ある学生は 3 回的中しました.そこで問題です.この学生の透視能力についてどのような判断を下すべき
か考えてみましょう.
2 つの結論が考えられます.
結論 1. 透視能力が無くても,5 回中 3 回ぐらいは偶然でも的中すると考えられるので,これだけのデータで
は透視能力があるとはいえない.
結論 2. 5 回中 3 回的中することは滅多にないことだから透視能力があると考える方がもっともらしい.
この 2 つの結論のどちらを選ぶべきかの基準に確率が用いられます.
まずこの学生がカードをあてる確率は毎回一定で,その確率は p とします.5 回の実験中的中する回数を X
とすると,X ∼ B(5, p) に従います.ここで透視能力がないということは ⌈p = 0.2⌋,透視能力があるというこ
とは ⌈p > 0.2⌋ と表わせます.
そこで
H0 : p = 0.2 (透視能力がない)
と仮定してみます.
ここで 5 回中 3 回以上的中する確率は
Pr (X ≥ 3) = Pr (X = 3) + Pr (X = 4) + Pr (X = 5)
( ) ( ) ( )
5 3 2 5 4 5
= (0.2) (0.8) + (0.2) (0.8) + (0.2)5 = 0.057922
3 4 5
となり,この確率を有意確率といいます.
実験の結果がそれほど稀な現象ではない,つまり有意確率がそれほど小さくないと判断した場合は結論 1 を
得ます.このことを仮説 H0 を容認するといいます.
実験の結果がきわめて稀な現象である,つまり 有意確率がきわめて小さいと判断した場合は結論 2 になりま
す.このことを仮説 H0 を棄却するといいます.
有意確率がどの程度小さければ,H0 を棄却したらよいかという基準を有意水準 (significance level) α と
よび,α として 0.05, 0.01 等が良く用いられます.この問題で有意水準を 0.05 とすると,仮説 H0 は棄却さ
れない (容認されます).つまりこの学生は透視能力がないと判断されます.
仮説 H0 が棄却される X の範囲は Pr (X ≥ 4) = 0.00672 より X ≥ 4 です.この範囲を棄却域 (critical
region) といいます.また H0 : p = 0.2 を帰無仮説 (null hypothesis),H1 : p > 0.2 を対立仮説 (alternative
hypothesis) といいます.
母数 θ に関する帰無仮説 H0 : θ = θ0 に対し対立仮説として次の 3 つがあります.
H1 : θ > θ0 , H1 : θ < θ0 , H1 : θ ̸= θ0
母数 θ に関する検定の手順
1. 帰無仮説,対立仮説を立てる.
2. 有意水準 α を定める.
6.1. 統計的検定の考え方 59
3. 帰無仮説のもとで検定に用いる統計量の分布を求める.
4. 棄却域を定める.
5. 検定統計量の実現値が棄却域に入るときは帰無仮説を棄却する.
(1) 母平均の検定
母集団が正規分布 N (µ, σ 2 ) に従がう,正規母集団から抽出された大きさ n の標本変量 (X1 , X2 , . . . , Xn ) を
2
考えます.このとき,これらの相加平均 X̄ は N (µ, σn ) に従がいます.ここで,母平均 µ についての検定を考
えます.
(a) σ 2 が既知の場合の µ の検定 (有意水準 α)
この場合は次の標本分布を用います.
X̄ − µ
Z=√ ∼ N (0, 1)
σ 2 /n
X̄ − µ
T =√ ∼ t(n − 1)
S ′ 2 /n
(2) 母分散の検定
母集団が正規分布 N (µ, σ 2 ) に従う,正規母集団から抽出された大きさ n の標本変量 (X1 , X2 , . . . , Xn ) を考
えます.ここで,母分散 σ 2 についての検定を考えます.
(a) µ が既知の場合の σ 2 の検定 (有意水準 α)
この場合は次の標本分布を用います.
1 ∑
n
χ2 = (Xi − µ)2 ∼ χ2α,n
σ 2 i=1
X̄ − µ0
Z0 = √ ∼ N (0, 1)
σ 2 /n
60 第 6 章 統計的検定
となります.有意水準 α に対して,
Pr (Z0 > zα ) = α であるような zα を正規分布表から読み取れば,有意水準 α の対立仮説 (1) に対する帰無
仮説の棄却域は Z0 > zα となります.
(1) の場合 Z0 > zα
これより各対立仮説に対する帰無仮説の棄却域は次の通りです. (2) の場合 Z0 < zα
(3) の場合 |Z0 | > z α2
例題 6.1
ある大学では一年生に対して毎年同じテストを行なっている.昨年度の一年生の成績は平均 64.5, 分散 20 の正
規分布に従っている.今年度の一年生にも同じテストを行ない,無作為に 8 人抽出したところ点数は次の通り
であった.
66 73 55 69 70 67 62 71
今年度の一年生の平均点は昨年度より高いか有意水準 5% で検定せよ.ただし,今年度の分散は,昨年度と
変わらないものとする.
解
今年度の 1 年生の平均点を µ とおき,昨年度より高いかの検定を行なうので,以下の帰無仮説と対立仮説を
立てる.
H0 : µ = 64.5
H1 : µ > 64.5
図 6.1: 正規分布
6.1. 統計的検定の考え方 61
これより,Z0 は帰無仮説の棄却域に入っていない.したがって,帰無仮説を棄却できない.言い換えると,
今年度の 1 年生は昨年度よりも優秀であるとは,結論付けることができない.
演習問題 6.1
σ12 σ2
X̄ ∼ N (µ1 , ), Ȳ ∼ N (µ2 , 2 )
n1 n2
となります.
1. 母平均の差 µ1 − µ2 の検定
(a) σ12 , σ22 既知の場合 ( )
σ2 σ22
X̄ − Y は正規分布の加法性より,正規分布 N µ1 − µ2 , n11 + n2 に従がいます.よって,
(X̄ − Ȳ ) − (µ1 − µ2 )
Z= √ ∼ N (0, 1)
σ12 /n1 + σ22 /n2
例題 6.2
4.82 4.82
X̄ ∼ N (µ1 , ), Ȳ ∼ N (µ2 , )
30 50
検定するないようは,題意より両校の身長に有意差があるかということより,
H0 : µ1 = µ2
H1 : µ1 ̸= µ2
有意水準 α = 0.05
統計量
(X̄ − Ȳ ) − (µ1 − µ2 )
Z= √ ∼ N (0, 1)
σ12 /n1 + σ22 /n2
H0 のもとで,
148.2 − 146.4
Z0 = √ = 1.6238
4.82 /30 + 4.82 /50
z0.05/2 = 1.96 より,
Z0 = 1.62 < z0.05/2 = 1.96
したがって,H0 は棄却されない.
(b) σ12 , σ22 が未知だが σ12 = σ22 とみなせる場合.
X1 , . . . , Xn1 , Y1 , . . . , Yn2 に対して不偏分散をそれぞれ S1′ , S2′ とします.
2 2
1 ∑ 1 ∑
S1′ = (Xi − X̄)2 , S2′ =
2 2
(Yi − Ȳ )2
n1 − 1 i n2 − 1 i
6.2. 母集団が正規分布で 2 標本の場合 63
これを合併した不偏分散
(n1 − 1)S1′ + (n2 − 1)S2′
2 2
σ̂ ′ =
2
n1 + n2 − 2
を考えます.これは,両方の標本分散
1 ∑ 1 ∑
S12 = (Xi − X̄)2 , S22 = (Yi − Ȳ )2
n1 i n2 i
を用いて
n1 S12 + n2 S22
σ̂ 2 =
n1 + n2 − 2
としても同じです.この σ̂ 2 を (a) で用いた式に代入すると,
(X̄ − Ȳ ) − (µ1 − µ2 )
T = √ ∼ t(n1 + n2 − 2)
σ̂ 2 /n1 + σ̂ 2 /n2
これは,自由度 n1 + n2 − 2 の t 分布に従がうことが分かっています.これを利用して,母平均の差の検定を
行うことができます.
例題 6.3
97.5 − 95.3
T0 = √ = 2.6342
1.7438/5 + 1.7438/5
したがって,H0 は棄却されない.
(c) σ12 , σ22 が未知
(X̄ − Ȳ ) − (µ1 − µ2 )
T =√ 2 ∼ t(ϕ),
S1 /(n1 − 1) + S22 /(n2 − 1)
64 第 6 章 統計的検定
n1 S12 n2 S22
2 ∼ χ2 (n1 − 1), ∼ χ2 (n2 − 1)
σ1 σ22
より
σ22 S1′
2
F = ∼ F (n1 − 1, n2 − 1)
σ12 S2′ 2
したがって,
1. 対立仮説が H1 : σ12 ̸= σ22 のときは,両側検定で,棄却域は
−1 α −1 α
W = {F : F > Fnn21−1 ( )} ∪ {F : F < Fnn21−1 (1 − )}
2 2
2. 対立仮説が H1 : σ12 > σ22 のとき棄却域は
−1
W = {F : F > Fnn21−1 (α)}
−1
W = {F : F < Fnn21−1 (1 − α)}
−1
しかし,Fnn21−1 (1 − α) は数表にありません.そこで,この場合は,
−1 1
Fnn21−1 (1 − α) = −1
Fnn12−1 (α)
を用いて計算します.
例題 6.4
H0 のもとで,
10(5.23)
9
F0 = 16(2.24)
= 2.1967
15
9
F15 (0.025) = 3.1227 より,
9
F0 = 2.1967 < F15 (0.05/2) = 3.1227
したがって,H0 は棄却できない.すなわち両方の母分散に有意差はない.
演習問題 6.2
A 71 79 92 91 87 79 77 89 71 84
B 63 84 71 81 80 84 71 84 64 84 69 77
を有意水準 5% で両側検定をしよう.
2 環境学部の A,B で数学の試験をした.A クラスから 10 名,B クラスから 12 名の成績を無作為に選んだ
ら次の表を得た.
A 71 79 92 91 87 79 77 89 71 84
B 63 84 71 81 80 84 71 84 64 84 69 77
H0 : σ 1 = σ 2
を有意水準 5% で左側検定をしよう.
66 第 6 章 統計的検定
6.3 比率の検定
母比率の検定 (大標本の場合) 母集団の中で,ある属性に対して事象 A の起こる割合 p を事象 A の母比率と
いいます.この母比率に関する仮説を,標本値から検定することを考えます.
母比率が p の二項母集団から抽出された大きさ n の標本を (X1 , . . . , Xn ) とします.ここで,
{
1 A のとき
Xi =
0 Āのとき
X
とします.このとき,X = X1 + · · · + Xn とすると,X は標本中 A であるものの個数を表す統計量で, は
n
事象 A の標本比率といいます.そのとき,母比率 p について,p0 (0 ≤ p0 ≤ 1) を既知の値として,帰無仮説
H0 : 「p = p0 」,対立仮説 H1 : 「p ̸= p0 」
を検定することが問題となります.
母比率 p の二項母集団から大きさ n の標本 (X1 , . . . , Xn ) をとり,X = X1 + · · · + Xn とすると X は二項
分布 B(n, p) に従います.ここで n が十分大きいときにはラプラスの定理によって,
( ) X は近似的に正規分布
N (np, np(1 − p)) に従い,標本比率 X
n = p̂ は近似的に正規分布 N p, p(1−p)
n に従います.よって,標準化を
行うと
p̂ − p
Z=√ ∼ N (0, 1)
p(1−p)
n
例題 6.5
1
サイコロを 600 回投げたところ,1 の目が 108 回出たという.1 の目が出る母比率 p は 6 か有意水準 5%で検
定せよ.
解答
H0 : 「1 の目の出る確率 p = 61 」
H1 : 「p ̸= 16 」
有意水準 α = 0.05
統計量
p̂ − p
Z=√ ∼ N (0, 1)
p(1−p)
n
108
H0 のもとで,p̂ = 600 = 0.18 より,
0.18 − 16
Z0 = √1 1
6 (1− 6 )
600
= 0.088
対立仮説より,標準正規分布の両側確率を用いる.
Z0 < Z 0.05
2
= 1.96
6.3. 比率の検定 67
したがって,H0 を容認.
母比率の差の検定
2つの母集団 A, B の中で 1 つの特性 C を持つものの母比率を p1 , p2 とする.この母集団からそれぞれ大き
さ n1 , n2 個の標本を抽出し,その特性を持つものの個数を X1 , X2 とする.このとき,母比率について
帰無仮説 H0 : 「p1 = p2 」と対立仮説 H1 : 「p1 ̸= p2 」
を検定することを考えます.帰無仮説のもとで,母比率の値 p1 , p2 は未知ですが,
p1 = p2 = p, 1 − p = q
例題 6.6
有意水準 α = 0.05
統計量
X1 /n1 − X2 /n2
Z=√ ∼ N (0, 1)
( n11 + n12 )p(1 − p)
120+180 1
H0 のもとで,p = 400+500 = 3 より,
120/400 − 180/500
Z0 = √
1
( 400 1 1
+ 500 ) 3 (1 − 13 )
= −1.897
68 第 6 章 統計的検定
対立仮説より,標準正規分布の両側確率を用いる.
したがって,H0 を容認.
演習問題 6.3
6.4 適合度検定
データにある確率分布をあてはめ,あてはまりのよさを検定するのが適合度検定 (goodness of fit test) で
す.この検定の問題に対して,標本は元のデータに対応します.また,想定した確率分布には,ある確率変数
X が対応しています.
(1) 多項分布に対する適合度の検定
ある試行の結果,k 個の事象 A1 , A2 , . . . , Ak のいずれかが現われるとします.ここで,Ai が起こる確率を
P (Ai ) とすると,
P (Ai ) = pi
p1 + p2 + · · · + pk = 1
例題 6.7
は χ2 (k − 1) に従う.
理論度数 mi と実測度数 Xi がすべての i について近い値であれば,χ2 は全体として小さな値となります.し
たがって,χ2 が大きな値となったとき,その理論値 mi に疑問が持たれます.このことから,次のような適合
度の検定が得られます.
mi = npi0
例題 6.8
目の数 1 2 3 4 5 6 計
回数 102 89 87 106 115 101 600
解
H0 : 「各目の現れる確率は等しい」(p1 , p2 , p3 , p4 , p5 , p6 = 16 , 16 , 61 , 16 , 16 , 61 )
H1 : 「各目の現れる確率は等しくない」(p1 , p2 , p3 , p4 , p5 , p6 ̸= 61 , 16 , 61 , 61 , 16 , 16 )
有意水準 α = 0.05
統計量
∑
6
(Xi − npi )2 ∑6
Xi2
χ2 = = −n
i=1
npi i=1
npi
H0 のもとで,
したがって,H0 を容認.
演習問題 6.4
遺伝形質 A B C D 計
観測度数 243 72 78 15 408
6.4. 適合度検定 71
(2) 確率分布に対する適合度の検定
ここでは,ある分布が正規分布に従う,あるいはポワソン分布に従う,ということ自体が帰無仮説となる適
合度検定を考えます.つまり,
帰無仮説 H0 : 「ある分布 D に従う」
を設定します.D の分布は既知であって,母数 θ1 , θ2 , . . . , θi を含んでいるとします.例えば,正規分布では
µ, σ 2 の 2 個の母数を含み,これらの値は不明であるとします.
次に排反な各階級 A1 , A2 , . . . , Ak に入る個数 (X1 , X2 , . . . , Xk ) の実現値を (x1 , x2 , . . . , xk ) とし,母数 θi を
この値を用いて推定します.つまり,
θi = θˆi (x1 , x2 , . . . , xk ) (i = 1, 2, . . . , l)
例題 6.9
死亡者数 0 1 2 3 4 計
部隊数 109 65 22 3 1 200
この表はポワソン分布に従うか,有意水準 5%で検定しよう.
H0 : 「ポワソン分布 P (λ) に従っている」
有意水準 α = 0.05
統計量
この表をポワソン分布とみて,死亡数の理論値を求める.これがポワソン分布 P (λ) によるものと考えて,λ
の値を推定する.死亡者数 k のときの確率を pk とすると,
∞
∑
kpk = E(X) = λ
k=0
死亡者数 k 0 1 2 3 4 計
部隊数 fk 109 65 22 3 1 200
kfk 0 65 44 9 4 122
pk 0.5435 0.3313 0.1011 0.0206 0.0031
理論度数 mk 108.7 66.3 20.2 4.1 0.6
72 第 6 章 統計的検定
∑
ここで,npk ≈ fk より k kfk ≈ λn.これより平均値 λ は
1∑ 122
λ≈ kfk = = 0.61
n 200
k
死亡者数 k 0 1 2 3 4 計
部隊数 xk 109 65 22 3 1 200
理論度数 mk 108.7 66.3 20.2 4.1 0.6
∑
2
(xi − mi )2
χ2 =
i=0
mi
H0 のもとで,
したがって,H0 を容認.
母数 λ が標本から 1 個推定されたので,自由度は 3 − 1 − 1 = 1 となる.
(3) 独立性の検定
母集団の要素は,すべて A, B の 2 種類の属性をもち,A, B はそれぞれ排反な A1 , . . . , Ak および B1 , . . . , Bl
に分かれているとします.母集団から大きさ n の標本を抽出して,Ai ∩ Bj に入る観測度数を xij とすると,次
の表のように行列の形に整理できる.
B1 B2 ··· Bl 和
A1 x11 x12 ··· x1l x1
A2 x21 x22 ··· x2l x2
.. .. .. ..
A3 . . . .
Ak xk1 xk2 ··· xkl xk
ここで,次のような適合度の検定を考える.
帰無仮説 : 「属性 A, B は独立である」
対立仮説 : 「属性 A, B は従属である」
帰無仮説 H0 のもとで
Pij = Pr (Ai ∩ Bj ) = Pr (Ai )Pr (Bj ) = pi qj
が成り立つ.ここで,pi , qj は母数なのでこれを最尤法によって推定すると,それらの推定値は
xi. x.j
pˆi = , qˆj =
n n
で与えられる.このとき,n が十分大きければ,帰無仮説 H0 のもとで統計量
∑k ∑ l
(Xij − nPij )2
χ2 =
i=1 j=1
nPij
∑k ∑ l
(xij − npˆi qˆj )2
χ20 =
i=1 j=1
npˆi qˆj
{ }
∑k ∑ l
x2ij ∑ k ∑ l
x2ij
= − 2xij + npˆi qˆj = n −1
npˆi qˆj x x
i=1 j=1 i=1 j=1 i. .j
となる.
75
第7章 演習問題解答
問題解答 1.1
1 スタージスの式から
階級数 = 1 + log 100
log 2 = 1 + 6.64 = 7.64 また最大値 440 最小値 300 より,階級幅は
階級幅 = 440−300
7.64 = 18.4 となるので,階級幅を 18 ととることにします.これより度数分布表を作成します.
表 7.1: 度数分布表
1
平均値 x = [318 · 2 + 336 · 10 + 354 · 25 + 363 · 31 + 381 · 8 + 399 · 18 + 417 · 5 + 435 · 1] = 365.16
100
最大値 440
最小値 300
360 + 360
中央値 = 360
2
最頻値 363
図 7.1: ヒストグラム
76 第 7 章 演習問題解答
図 7.2: 累積度数分布表
問題解答 1.2
1
電卓を使う場合は必ず途中の値を書く必要があります.また,計算は小数点以下 2 桁までで表わすことにし
ます.
Tx = 841 Ty = 806
x = 35.04 y = 33.58
∑24 ∑24
Txx = x2i = 45553 Tyy yi2 = 36990
√i=1 i=1 √
1 1
sx = Txx − (x)2 = 25.88 sy = Tyy − (y)2 = 20.34
24 24
∑24
Txy = xi yi = 37192
i=1
これより
1 Tx Ty
sxy = Txy −
n n n
1 841 806
= · 37192 − · = 372.85
24 24 24
sxy 372.85
r= = = 0.71
sx sy 25.88 · 20.34
これより正の相関でかなり強い相関があるといえる.
問題解答 1.3
1
log n log 24
階級数 = 1 + log 2 =1+ log 2 = 1 + 4.58 = 5.58
また x の最大値 109 最小値 13 より
109−13
階級幅 = 5.58 = 17.20
これより x の階級幅を 17 と取ります.また y の最大値 65 最小値 5 より
65 − 5
階級幅 = = 10.75
5.58
これより y の階級幅を 10 と取ります.
77
表 7.2: 相関表
x 10 ∼ 27 27 ∼ 44 44 ∼ 61 61 ∼ 78 78 ∼ 95 95 ∼ 112
y 階級値 18.5 35.5 52.5 69.5 86.5 103.5 計
0 ∼ 10 5 3 3
10 ∼ 20 15 6 6
20 ∼ 30 25 1 2 3
30 ∼ 40 35 1 1
40 ∼ 50 45 1 1 2
50 ∼ 60 55 2 3 2 7
60 ∼ 70 65 1 1 2
13 7 1 3 1 24
Tx = 841 Ty = 806
x = 35.04 y = 33.58
∑24 ∑24
Txx = x2i = 45553 Tyy yi2 = 36990
√i=1 i=1 √
1 1
sx = Txx − (x)2 = 25.88 sy = Tyy − (y)2 = 20.34
24 24
∑24
Txy = xi yi = 37192
i=1
1 Tx Ty
sxy = Txy −
n n n
1 841 806
= · 37192 − · = 372.85
24 24 24
sxy 372.85
r= = = 0.71
sx sy 25.88 · 20.34
これより,x 上の y の回帰直線は
372.85
y − 33.58 = (x − 35.04) = 0.56(x − 35.04)
670.24
したがって
y = 0.56x + 13.96
問題解答 2.1
1.
(a) ここでは ¤ ¤ ¤ ¤ の ¤ の中に異なる数字を入れて 4 桁の数字を何個作れるか考えてみます.まず,4 桁
の数字なので,千の位の ¤ には 0 を使うことができません.そこで千の位は 1 から 6 までの 6 個の中から 1 個
選ぶことになるので,6 通り.百の位から一の位までは 0 から 6 までのどの数字も使うことができます.しか
し,数字を取り出して並べるため,同じ数字は 2 度使えないことに注意して下さい.では並べてみましょう.
78 第 7 章 演習問題解答
まず,百の位には千の位で用いられた数字以外どれでも使えるので,6 通りあります.十の位は千の位と百
の位で用いられた数字以外どれでも使えるので,5 通りあります.最後に一の位は千の位,百の位,十の位で
用いられたもの以外すべて使えるので 4 通り.よって全部で
6 · 6 · 5 · 4 = 720
個の 4 桁の数字を作ることができます.
ここで百の位,十の位,一の位は千の位で用いられた数字以外どれでも 1 回づつ使うことができることに注
意すると,6 個の中から 3 個を取り出し順序をつけて並べる順列の数になるので 6 P3 と表わせます.よって
6 · 6 P3 = 6 · 6 · 5 · 4 = 720
6 · 7 Π3 = 6 · 7 · 7 · 7 = 2058 通り
2.
(a) 1 から 10 までの番号のついたカードから 6 枚を取り出すとき,何通りの取り出し方があるかを考えます.
このとき,一枚づつ順に取り出し並べるわけではないので,取り出す順序を考える必要はありません.よって,
何通りの組み合わせがあるかを考えればよいでしょう.
10 個の中から 6 個を取り出す組み合わせは 10 C6 なので,
10! 10 · 9 · 8 · 7
10 C6 = = = 210 通り
4!6! 4·3·2·1
(b) 1 と 2 のカードを含むとは取り出した 6 枚の中に必ず 1 と 2 のカードが入っていなければならないという
ことです.
これは 1 と 2 を先に引いておいて残りの 4 枚を 3 から 10 までの 8 枚から選ぶ選び方と考えることができま
す.よって 8 C4 = 70 通り.
(c) 1 のカードを含む場合を C1 ,2 のカードを含む場合を C2 とします.すると C1 は 9 C5 通り,C2 も 9 C5 通
りとなるので,1 または 2 を含む場合は
9 C5 + 9 C5 − 70 = 252 − 70 = 182 通り
79
1 + 5 + 10 + 10 + 5 + 1 = 32 通り
4.
(a) a, b が隣り合うので,a, b の順に並んでいるのを A とおくと,この問題は 5 文字を一列に並べる並べ方は
何通りあるかという問題と同じになります.したがって,
5 P5 = 5! = 120
5 P5 = 5! = 120
{1 ¤ ¤ ¤ ¤ ¤}
6 C4 · 52 375
Pr (X4 ) = =
66 46656
別解
6 回中 4 回 1 の目がでる組み合わせは 6 C4 通り.また,それぞれの確率は
( )4 ( )2
1 5
·
6 6
よって,
( )4 ( )2
1 5 375 125
Pr (X4 ) = 6 C4 · = =
6 6 46656 15552
(c) 1 の目が出るのは 4 回以下とは
X 0 ∪ X1 ∪ X2 ∪ X 3 ∪ X 4
のことです.ここで,それぞれの事象は同時に起こりえないことに注意すると,
5 C2 × 5 C2 10
=
C
10 4 21
5 C0 · 5 C4 + 5 C1 · 5 C3 + 5 C2 × 5 C2 31
=
10 C4 42
3.したがって,白,赤,黒がともに含まれる確率は
( )
4 5 32 1
=
2, 1, 1 10 9 8 2
3.
(a) 1 から 10 までがその順に一列に並ぶ場合を考えているので,まずは,1 から 10 を勝手に一列に並べる並
べ方は何通りあるか考えてみましょう.
先頭にくるのは 1 から 10 の内どれでもよいので,10 通り,次は 9 通り,
...となるので,全部で 10 P10 = 10!
通りとなります.
次に 1 から 10 までがその順に一列に並ぶ場合は一通り.したがって,その確率は
1
10!
1 1
別解 1 が先頭にくる確率は ,1 が先頭にきたことが分ったあと,2 が 2 番目にくる確率は ,1 が先頭,2 が
10 9
1
2 番目にきたことが分ったあと,3 が 3 番目にくる確率は , .
..となるので,1 から 10 までがその順に一列に
8
並ぶ確率は
1 1 1 1
· ··· =
10 9 1 10!
(b) 4 のカードがちょうど 4 番目ということは,それ以外の 9 枚のカードはどこにあってもいいので,4 のカー
ドがちょうど 4 番目にくるのは 9 P9 = 9! 通りあります.よってその確率は
9 P9 9! 1
= =
10 P10 10! 10
1
別解 4 のカードがちょうど 4 番目にくる確率は
10
(c) 1 が最初に,4 が 4 番目にあるということは,それ以外の 8 枚のカードはどこにあってもいいので,全部で
8 P8 通り.よって,1 が最初に,4 が 4 番目にくる確率は
8 P8 8! 1 1
= = =
10 P10 10! 10 · 9 90
1 1
別解 1 が最初にくる確率は .次に 1 が最初にきたことが分ったあと,4 が 4 番目にくる確率は .よって,
10 9
1 が最初に,4 が 4 番目にくる確率は
1
90
4.
(a) 円板の半径は 1.5cm よりちょうど正方形の中に入るには,円板の中心が 1 辺 5cm の正方形の中にあれば
よい.したがって,その確率は
1 辺 5cm の正方形の面積 25
=
1 辺 8cm の正方形の面積 64
(b) A = 「円板が正方形の辺にかかる」の余事象は Ā = 「円板が正方形の中にある」となる.したがって,
その確率は
1 辺 5cm の正方形の面積 39
1− =
1 辺 8cm の正方形の面積 64
83
π(1.5)2
64
5.
(a) 白玉 4 個,赤玉 6 個,合わせて 10 個の中から 2 個を取り出す組み合わせは 10 C2 通り.白玉 2 個を袋の中
から取り出す組み合わせを考えてみましょう.
袋の中の 4 個の白玉から 2 個を取り出すしかないので,その組み合わせは 4 C2 通り.したがって,取り出し
た 2 個が両方白玉の確率は
4 C2
4!
2!2! 4·3 2
= = =
10 C2
10!
8!2!
10 · 9 15
(b) 1 個だけ白玉ということは 4 個の白玉から 1 個取り出し,6 個の赤玉から 1 個取り出す場合の数なので,
4 C1 × 6 C1 .よってその確率は
4 C1 × 6 C1 4×6 8
= =
C
10 2 45 15
(c) 少なくとも 1 個は白玉という事象は,2 個とも白玉であるか,または 1 個だけ白玉であるかのどちらかで
す.ここで,これらの事象は排反事象 (同時に起きない) であることに注意すると,全部で,4 C2 + 4 C1 × 6 C1
通り.したがって,求める確率は
4 C2 + 4 C1 × 6 C1 2 8 2
= + =
10 C2 15 15 3
問題解答 2.3
1.
(a) 4 回投げて少なくとも 1 回 6 の目がでるという事象 A の余事象 A は,4 回投げて一度も 6 の目がでないと
5
なります.ここで,それぞれの回に 6 の目がでない確率は に注意すると,
6
( )4
5
Pr (A) =
6
となるので,これより,
( )4
5 671
Pr (A) = 1 − Pr (A) = 1 − =
6 1296
(b) 2 個のさいころを同時に 24 回投げて少なくとも 1 回 2 個とも 6 の目がでるという事象 B を考えます.ま
1
ず,2 個のさいころを同時に投げたとき,2 個とも 6 の目がでる確率は .
36
ここで,B の余事象 B は,2 個のさいころを同時に 24 回投げて一度も 2 個両方は 6 の目ではないとなりま
す.したがって,
( )24 ( )24
1 35
Pr (B) = 1 − =
36 36
これより
( )24
35
Pr (B) = 1 − Pr (B) = 1 − = 0.491
36
84 第 7 章 演習問題解答
2 A =「真のガン患者」,B =「精密検査で陽性反応がでた患者」とおくと質問は,患者がその精密検査の結
果陽性反応を示した場合にガン患者である確率を求めることです.これは条件付き確率を用いると次のように
表わせます.
Pr (A|B)
また,Pr (A) = 0.05,Pr (B|A) = 0.85,Pr (B|A) = 0.05 が分っていることに注意します.ここで,Bayes の定
理を用いると
B = B ∩ Ω = B ∩ (A ∪ A) = (B ∩ A) ∪ (B ∩ A)
より
A A
B
B
0.85
0.05
0.05 0.95
3.
(a)
x∈A∪B ⇔ x ̸∈ A ∪ B
⇔ x ̸∈ A and x ̸∈ B
⇔ x ∈ A and x ∈ B
⇔ x∈A∩x∈B
これより,
A∪B =A∩B
したがって,
P (A ∪ B) = P (A ∩ B)
85
(b)
x∈A∩B ⇔ x ̸∈ A ∩ B
⇔ x ̸∈ A or x ̸∈ B
⇔ x ∈ A or x ∈ B
⇔ x∈A∪x∈B
これより,
A∩B =A∪B
したがって,
P (A ∩ B) = P (A ∪ B)
P ((B ∪ C) | A) = P (B | A ∪ C | A) = P (B | A) + P (C | A)
問題解答 3.1
1. X を 4 児をもつ家庭の男児の数とすると,
( ) ( )4
4 1 1
P (x = 0) = =
0 2 16
( ) ( )4
4 1 4
P (x = 1) = =
1 2 16
( ) ( )4
4 1 6
P (x = 2) = =
2 2 16
( ) ( )4
4 1 4
P (x = 3) = =
3 2 16
( ) ( )4
4 1 1
P (x = 4) = =
4 2 16
よってその確率分布 f は
( ) ( )4
4 1
f (i) = P (X = i) =
i 2
で与えられる.
2. 10 個から 3 個取り出す組み合わせは 10 C3 = 120 通り.また,3 個中赤がゼロということは,白が 3 個と同
じことなので,6 個の白から 3 個取り出すこととなり,その組み合わせは 6 C3 = 20 通り.よって,X を赤玉
の個数とおくと,
6 C3 6·5·4 1
Pr (x = 0) = = =
10 C3 10 · 9 · 8 6
3 個中 1 個赤ということは残りの 2 個は白なので
4 C1· 6 C2 4·6·5 3·2·1 1
Pr (X = 1) = = · =
C
10 3 2 · 1 10 · 9 · 8 2
86 第 7 章 演習問題解答
同様にして,
X 0 1 2 3
1 1 6 1
P (X = i) 6 2 20 30
1 5
Pr (1 ≤ X ≤ 3) = 1 − Pr (X = 0) = 1 − =
6 6
3.
(a) f (x) が確率密度関数であるためには,
を満たしていることを示せばよい.そこで,
1. 定数 k を 0 以上とすれば f (x) ≥ 0 は満たされる.
∫∞ ∫
2. −∞ f (x)dx = ab kdx = kx |ba = k(b − a) より k = 1
と定めればよい.
∫c b−a
(b) P (X ≤ c) = F (c) = −∞ f (x)dx より
∫ ∫
c c
1 c−a
P (X ≤ c) = f (x)dx = dx =
a a b−a b−a
となる.
(4)
(a) 分布関数 F (x) は ∫ x
F (x) = Pr (X ≤ x) = f (t)dt
−∞
で与えられることに注意します.
x ≤ 0 のとき ∫ ∫
x x
F (x) = f (t)dt = 0dt = 0
−∞ −∞
x > 1 のとき ∫ ∫ ∫ ∫
x 0 1 x
F (x) = f (t)dt = 0dt + 6t(1 − t)dt + 0dt = 1
−∞ −∞ 0 1
(b)
0.7
Pr (X ≤ 0.7) = Pr (0 < X ≤ 0.7) = F (0.7) − F (0) = [F (x)]0
[ ]0.7
= 3x2 − 2x3 0 = 3(0.7)2 − 2(0.7)3
87
0.8 [ ]0.8
Pr (0.2 < X ≤ 0.8) = [F (x)]0.2 = 3x2 − 2x3 0.2
= 3(0.8)2 − 2(0.8)3 − (3(0.2)2 − 2(0.2)3 )
4.
(a)
∫∞
f (x) ≥ 0 と −∞ f (x)dx = 1 を示せばよいでしょう.
1. f (x) = e−x は指数関数より全ての x で f (x) > 0.
2.
∫ ∞ ∫ 0 ∫ ∞
f (x)dx = f (x)dx + f (x)dx
−∞ −∞ 0
∫ 0 ∫ ∞
= 0dx + e−x dx
−∞ 0
[ ]
−x ∞−
= 0+ −e 0
=1
問題解答 3.2
1. W = XY とおくと W の変域は {1, 2, 3, 4, 5, 6, 8, 9, 10, 12, 15, 16, 18, 20, 24, 25, 30, 36} である.また,確率
分布 h(i) は P (W = i) で与えれることに注意する.まず,h(1) を考えてみよう.h(1) = P (W = 1) より,2 個
のサイコロを投げて両方 1 の目が出る確率を求めることと同じである.場合の数を求めると,両方 1 の目の組
1
み合わせは 36 通り中の 1 通り.したがって P (W = 1) = 36 .同様に,W = 2, 3, 4, . . . , 36 について求めると
i 1 2 3 4 5 6 8 9 10 12 15 16 18 20 24 25 30 36
1 2 2 3 2 4 2 1 2 4 2 1 2 2 2 1 2 1
h(i) 36 36 36 36 36 36 36 36 36 36 36 36 36 36 36 36 36 36
1 3 5 8 10 14 16 17 19 23 25 26 28 30 32 33 35 36
H(i) 36 36 36 36 36 36 36 36 36 36 36 36 36 36 36 36 36 36
2.
(a) W = X + Y + Z とおくと W の変域は {0, 1, 2, 3} である.確率分布 h(i) は P (W = i) で与えられる.ま
ず,h(0) を考えてみよう.h(0) = P (W = 0) より,3 枚銅貨を投げて全て裏が出る確率を求めることと同じで
1
ある.場合の数を求めると,全部裏の組み合わせは 8 通り中の 1 通り.したがって P (W = 0) = 8 .同様に,
88 第 7 章 演習問題解答
W = 1, 2, 3 について求めると
()
h(0) = P (W = 0) = 30 ( 21 )3 = 1
() 8
h(1) = P (W = 1) = 31 ( 21 )3 = 3
() 8
h(2) = P (W = 2) = 32 ( 21 )3 = 3
() 8
h(3) = P (W = 3) = 33 ( 21 )3 = 1
8
H(0) = P (W ≤ 0) = 1
8
H(1) = P (W ≤ 1) = 1
8 + 3
8 = 12
H(2) = P (W ≤ 2) = 1
8 + 3
8 + 38 = 7
8
H(3) = P (W ≤ 3) = 1
8 + 3
8 + 3
8 + 1
8 =1
問題解答 3.3
(1)
(a) {
1 + x −1 < x < 0
1 − |x| =
1−x 0<x<1
より f (x) ≥ 0.また
∫ ∞ ∫ −1 ∫ 0 ∫ 1 ∫ ∞
f (x)dx = 0dt + (1 + t)dt + (1 − t)dt + 0dt
−∞ −∞ −1 0 1
[ ]0 [ ]1
t2 t2
= t+ + t−
2 −1 2 0
1 1
= −(−1 + ) + 1 − = 1
2 2
∫∞
別解 f (x) ≥ 0 より, −∞
f (x)dx は f (x) と x 軸の間の面積と考えられる.したがって,求める面積は底辺 2
高さ 1 の三角形の面積より 1.
(b)
x < −1 のとき ∫ 0
F (x) = Pr (X ≤ x) = 0dt = 0
−∞
∫ ∞
E(X 2 ) = x2 f (x)dx
−∞
∫ −1 ∫ 0 ∫ 1 ∫ ∞
= 0dx + x2 (1 + x)dx + x2 (1 − x)dx + 0dx
−∞ −1 0 1
[ ]0 [ 3 ]1
x3 x4 x x4
= + + −
3 4 −1 3 4 0
1 1 1 1 2 1 1
= −(− + ) + − = − =
3 4 3 4 3 2 6
これより
1
V (X) = E(X 2 ) − E(X)2 =
6
2.
(a) 1 の目が出る回数を X とすると,
( ) ( )3
3 5 125
Pr (X = 0) = =
0 6 216
( ) ( ) ( )2
3 1 5 25
Pr (X = 1) = =
1 6 6 72
( ) ( )2 ( )
3 1 5 5
Pr (X = 2) = =
2 6 6 72
( ) ( )3
3 1 1
Pr (X = 3) = =
3 6 216
別解 この試行はベルヌーイ試行である.つまり,
90 第 7 章 演習問題解答
事象「1 の目がでる」が発生するか否かを問う
この事象の発生はそれぞれの試行において独立である
この事象の発生は各試行において一定である
が知られています.
(b)
∑
n
125 25 5 1 1
E(X) = i · Pr (X = i) = 0 · +1· +2· +3· =
i=0
216 72 72 216 2
∑
n
125 25 5 1 2
E(X 2 ) = i2 · Pr (X = i) = 0 · +1· + 22 · + 32 · =
i=0
216 72 72 216 3
( )2
2 2 1 5
V (X) = E(X 2 ) − (E(X)) = − =
3 2 12
したがって, √
√ 5
D(X) = V (X) =
12
別解
1 1 1 5 5
E(X) = 3 ·
= , V (X) = 3 · · =
6 2 6 6 12
(c) X の標準化とは平均 µ を 0 に分散 σ 2 を 1 に変えることである.そこで X の標準化は
X −µ X−1
Z= √ = √ 2
σ2 1
6
次に Z の確率分布を求めてみよう.
√
X− 1
0 − 12 3
Pr (X = 0) = Pr √ 2
= √ = Pr (Z = − )
5 5 5
12 12
より √
3 125
Pr (Z = −
) = Pr (X = 0) =
5 216
√
X − 12 1 − 21 3
Pr (X = 1) = Pr √ = √ = Pr (Z = )
5 5 5
12 12
91
より √
3 25
Pr (Z =
) = Pr (X = 0) =
5 72
√
X − 12 2 − 12 3 3
Pr (X = 2) = Pr √ = √ = Pr (Z = )
5 5 5
12 12
より √ √
3 3 25
Pr (Z = ) = Pr (X = 0) =
5 72
√
X − 12 3 − 12 5 3
Pr (X = 3) = Pr √ = √ = Pr (Z = )
5 5 5
12 12
より √ √
5 3 1
Pr (Z = ) = Pr (X = 0) =
5 216
3
(a) Bernoulli の定理は試行回数が n,事象発生回数が r,事象発生確率が p のとき
r p(1 − p)
Pr (| − p| ≤ ε) ≥ 1 −
n nε2
が成り立つといっているので,
r 1 1 1
(1 − 21 ) 39
Pr (| − |≤ )≥1− 2 1 2
=
1000 2 10 1000( 10 ) 40
(b)
r 1 1 1
(1 − 14 ) 3
Pr (| − |≤ )≥1− 4 1 2
=
1000 4 10 1000( 10 ) 160
(c) この問題は試行回数が 2000 のとき,事象発生回数 r の偏りが 50 回以内である確率を求めよということで
r 1 50
ある.言い換えると,2000 回中の表が現われる割合 2000 と理論的確率 p = 2 との誤差が 1000 である確率を求
めよということになる.そこで Bernoulli の定理を用いると
r p(1 − p)
P (| − p| ≤ ε) ≥ 1 −
n nε2
より
r 1 50 1
(1 − 12 )
P (| − |< ) ≥ 1− 2 1 2
2000 2 1000 2000( 20 )
1
= 1− 4
= 1 − 0.05 = 0.95
5
r 1
(d) この問題は n 回中の表が現われる割合 n と理論的確率 p = 2 との誤差が 0.05% である確率が 99% 以上に
なるには何回以上投げればよいかということを聞いている.そこで Bernoulli の定理を用いると
r p(1 − p)
P (| − p| ≤ ε) ≥ 1 −
n nε2
92 第 7 章 演習問題解答
p(1−p)
より 1 − nε2 ≥ 0.99 である n を求めればよい.
1
2 (1− 12 ) 1
2 (1− 21 )
1− ≥ 0.99 ⇒ ≤ 0.01 ⇒
n(0.05)2 n(0.05)2
1
n ≥ = 10000
4(0.05)2 0.01
問題解答 3.4
1.
(a) W = X + Y + Z とおくと W の変域は {0, 1, 2, 3} である.確率分布 h(i) は P (W = i) で与えれれる.ま
ず,h(0) を考えてみよう.h(0) = P (W = 0) より,3 枚銅貨を投げて全て裏が出る確率を求めることと同じで
1
ある.場合の数を求めると,全部裏の組み合わせは 8 通り中の 1 通り.したがって P (W = 0) = 8 .同様に,
W = 1, 2, 3 について求めると
()
h(0) = P (W = 0) = 30 ( 21 )3 = 1
() 8
h(1) = P (W = 1) = 31 ( 21 )3 = 3
() 8
h(2) = P (W = 2) = 32 ( 21 )3 = 3
() 8
h(3) = P (W = 3) = 33 ( 21 )3 = 1
8
H(0) = P (W ≤ 0) = 1
8
H(1) = P (W ≤ 1) = 1
8 + 3
8 = 1
2
H(2) = P (W ≤ 2) = 1
8 + 3
8 + 3
8 = 78
H(3) = P (W ≤ 3) = 1
8 + 3
8 + 3
8 + 18 = 1
で与えられることに注意すればすぐに求まる.
1 1 1
E(X) = 0 · +1· =
2 2 2
1 1 1
E(Y ) = 0 · +1· =
2 2 2
1 1 1
E(Z) = 0 · + 1 · =
2 2 2
より
3
E(W ) =
2
別解 W の確率分布が分かっているので,直接求めることも可能である.
1 3 3 1 3
E(W ) = 0 · +1· +2· +3· =
8 8 8 8 2
次に W の分散 V (W ) を求める.一般に V (W ) = E(W 2 ) − (E(W ))2 を用いて求める方が簡単であるが,こ
3
の問題では W の確率分布が分かっているので直接求める方が簡単である.E(X) = 2 より
3 1 3 3 3 3 3 1 3
V (W ) = {(0 − )2 + (1 − )2 + (2 − )2 + (3 − )2 =
2 8 2 8 2 8 2 8 4
93
2.
(a) Y の確率密度関数 g(x) を求めるには Y の分布関数 G(y) について調べ,g(y) = G′ (y) の関係を用いる.
X の分布関数 F (x) は F (x) = P (X ≤ x),Y の分布関数 G(y) は G(y) = P (Y ≤ y) で与えられるので,
y−3 y−3
G(y) = P (Y ≤ y) = P (2X + 3 ≤ y) = P (X ≤ ) = F( )
2 2
を得る.次に,X の確率密度関数は f (x) = 2x (0 ≤ x < 1) で与えられていることに注意すると,Y の確率密
度関数 g(y) は,
y−3 1 1 y−3 y−3
g(y) = G′ (y) = F ′ ( ) = f( )=
2 2 2 2 2
となる.
Y の期待値 E(Y ) = E(2X +∫3) = 2E(X) + E(3) = 2E(X) + 3 より E(Y ) を求めるには,E(X) を求めれ
∞
ばよいことが分かる.E(X) = xf (x) dx で与えられるので,
−∞
∫ 1 ∫ 1
2 3 1 2
E(X) = x(2x)dx = 2x2 dx = x |0 =
0 0 3 3
4
+ 3 = 13
したがって,E(Y ) = E(2X + 3) = 2E(X) + 3 = 3 ∫1 3
注 : Y の確率密度関数を求めたので,直接 E(Y ) を E(Y ) = 0 y−3 2 dy で求めることもできる.
最後に Y の分散を求める.ここで V (2X + 3) = V (2X), V (2X) = 22 V (X), V (X) = E(X 2 ) − (E(X))2 に
注意すると V (Y ) を求めるには E(X 2 ) を求めればよいことが分かる.
∫ ∞ ∫ 1
1 1
E(X 2 ) = x2 f (x)dx = 2x3 dx = x4 |10 =
−∞ 0 2 2
より
1 2 2
V (Y ) = V (2X + 3) = 4V (X) = 4[E(X 2 ) − (E(X))2 ] = 4[ − ( )2 ] =
2 3 9
(b) Z の確率密度関数 h(z) を求めるには Z の分布関数 H(z) について調べ,h(z) = H ′ (z) の関係を用いる.
X の分布関数 F (x) は F (x) = P (X ≤ x),Z の分布関数 H(z) は H(z) = P (Z ≤ z) で与えられるので,
√ √ √ √ √
H(z) = P (Z ≤ z) = P (X 2 ≤ z) = P (|X| ≤ z) = P (X ≤ z) − P (X ≤ − z) = F ( z) − F (− z)
最後に Z の分散を求める.
∫ ∞ ∫ 1
1 4 1 1
V (Z) = V (X 2 ) = x2 f (x)dx = 2x3 dx = x |0 =
−∞ 0 2 2
より
1 2 2
V (Y ) = V (2X + 3) = 4V (X) = 4[E(X 2 ) − (E(X))2 ] = 4[ − ( )2 ] =
2 3 9
3.
(a) W = XY とおくと,X ,Y は独立である.したがって,その期待値は
さらに
1 1 1 1 1 1
E(X 2 ) = 1 · + 22 + 32 + 42 + 52 + 62
6 6 6 6 6 6
ここで
1
12 + 22 + 32 + · + n2 = (n(n + 1)(2n + 1)
6
を用いると
11 91
E(X 2 ) = (6(7)(13)) =
66 6
91
同様に E(Y 2 ) = 6 となるので,求める V (W ) は
7 91 7 11515
V (W ) = E((XY )2 ) − ( )4 = ( )2 − ( )4 =
2 6 2 144
となる.
問題解答 4.1
()
1. pr = P (X = r) = 8r (0.4)r (0.6)1−r より
r 0 1 2 3 4 5 6 7 8
Pr 0.0168 0.0896 0.209 0.2787 0.2322 0.1239 0.0413 0.0079 0.0007
()
pr = P (X = r) = 8r (0.2)r (0.8)1−r より
r 0 1 2 3 4 5 6 7 8
Pr 0.1678 0.3355 0.2936 0.1468 0.0459 0.0092 0.0011 0.0001 2.56 × 10−6
95
2. プラモデルを取り出す試行はベルヌーイ試行.X を部品がかけているプラモデルのセットの数とすると,
X ∼ B(3,25
2
).よって,選んだ3セットが全て完全なセットである確率は
( )
3 2 0 2
P (X = 0) = ( ) (1 − )3 = 0.7789
0 25 25
0.80 −0.8
Pr (X = 0) = e = 0.4493
0!
死亡者 6 名以上の日とは,Pr (X ≥ 6) を求めることになる。よって,
Pr (X ≥ 6) = 1 − Pr (X ≤ 5)
0.80 −0.8
Pr (X = 0) = e = 0.4493
0!
0.81 −0.8
Pr (X = 1) = e = 0.3595
1!
2
0.8 −0.8
Pr (X = 2) = e = 0.1438
2!
0.83 −0.8
Pr (X = 3) = e = 0.0383
3!
0.84 −0.8
Pr (X = 4) = e = 0.0077
4!
0.85 −0.8
Pr (X = 5) = e = 0.0012
5!
これより,
Pr (X ≥ 6) = 1 − 0.9998 = 0.0002
96 第 7 章 演習問題解答
2. X を放射性物質から 1 秒間に放出される粒子の数とすると,粒子の放出はポワソン過程である。よって,一
秒間での事象の平均発生回数 λ は3となる。これより,一秒間に 0 個の粒子が放出される確率は
30 −3
Pr (X = 0) = e = 0.0498
0!
同様に,
31 −3
Pr (X = 1) = e = 0.1494
1!
32 −3
Pr (X = 2) = e = 0.2240
2!
3
3 −3
Pr (X = 3) = e = 0.2240
3!
34 −3
Pr (X = 4) = e = 0.1680
4!
35 −3
Pr (X = 5) = e = 0.1008
5!
36 −3
Pr (X = 6) = e = 0.0504
6!
(b)
2.
(a) Pr (|Z| > λ) = 0.05 を満たす λ を求める。標準正規分布表により,Pr (0 ≤ Z ≤ z) の値が与えられている。
そこで,
Pr (|Z| > λ) = 1 − Pr (|Z| ≤ λ)
97
と書き直すと,
1
Pr (0 ≤ Z ≤ λ) = (1 − Pr (|Z| > λ)) = 0.225
2
これより,λ = 1.645 を得る。
(b) Pr (|Z| > λ) = 0.05 を満たす λ を求める。標準正規分布表により,Pr (0 ≤ Z ≤ z) の値が与えられている。
そこで,
Pr (Z > λ) = 0.5 − Pr (0 ≤ Z ≤ λ)
と書き直すと,
Pr (0 ≤ Z ≤ λ) = 0.5 − Pr (Z > λ) = 0.45
X − 168.9
Z=
5.6
次に,標準正規分布表より,
を満たす z を求めると,
Pr (0 ≤ Z ≤ 0.255) = 0.1
Pr (0 ≤ Z ≤ 0.525) = 0.2
Pr (0 ≤ Z ≤ 0.845) = 0.3
Pr (0 ≤ Z ≤ 1.281) = 0.4
Pr (0 ≤ Z ≤ 3.4) = 0.5
−3.4 ∼ −1.281 ∼ −0.845 ∼ −0.525 ∼ −0.255 ∼ 0 ∼ 0.255 ∼ 0.525 ∼ 0.845 ∼ 1.281 ∼ 3.4
5.62
X̄ ∼ N (168.9, )
120
ここで,身長の平均が 168.9cm より 1.3cm 以上かたよる確率は
で求まる。ここで,
X̄ − 168.9 1.3
Pr (0 ≤ X̄ − 168.9 < 1.3) = Pr (0 ≤ √ ≤ √ ) = Pr (0 ≤ Z ≤ 2.543) = 0.4945
5.6/ 120 5.6/ 120
98 第 7 章 演習問題解答
より,
Pr (|X̄ − 168.9| ≥ 1.3) = 1 − 2(0.4945) = 0.011
4.
(a) X ∼ B(100, 0.02) より,期待値 E(X) = np = 2 となり,ポワソン分布で近似できる。X ∼ Po (λ),
λ = E(X) = 2 より,
Pr (X ≥ 2) =
1 − Pr (X < 2) = 1 − Pr (X = 0) − Pr (X = 1)
20 21
= 1 − Po (0) − Po (1) = 1 − e−2 − e−2 = 0.594
0! 1
(b) X ∼ B(100, 0.2) より,期待値 E(X) = np = 20 となり,正規分布で近似できる。µ = E(X) = np =
20, σ 2 = V (X) = np(1 − p) = 16 より,X ∼ N (20, 42 )。これより
X − 20 25 − 20
Pr (X ≥ 25) = 1 − Pr (0 ≤ X < 25) = 1 − Pr (0 ≤ < )
4 4
= 1 − Pr (0 ≤ Z < 1.25) = 1 − 0.3944 = 0.6056
で求まるが,µ = E(X) = np = 100, σ 2 = V (X) = npq = 500/6 より,X ∼ N (100, 500/6) の正規分布で近似
できることが分かる。正規分布を用いると
90 − 100 √
Pr (90 ≤ X ≤ 100) = Pr ( √ ≤ Z ≤ 0) = Pr (0 ≤ Z ≤ 1.2)
500/6
= Pr (0 ≤ Z ≤ 1.095) = 0.3621
問題解答 4.4
1.
(a)
∞
∑
η(t) = E(tX ) = tk P (X = k)
k=0
∞
∑
= tk (1 − p)k p
k=0
99
より,両辺を t について微分すると,
∞
∑
η ′ (t) = ktk−1 (1 − p)k p
k=1
ここで,t = 0 とおくと
∞
∑ ∞
∑
η ′ (0) = E(X) = k(1 − p)k p = p kq k
k=1 k=1
∑∞
ちょっと,難しいが S = k=1 kq とおき,S − qS = S(1 − q) = Sp を求めると,
k
∞
∑ ∞
∑
Sp = S − qS = kq k − kq k+1
k=1 k=1
∞
∑ q q
= qk = =
1−q p
k=1
q
となる。これより,S = p2 となり,
q q
E(X) = p 2
=
p p
(b) X をはじめて勝つ直前までの試合回数とおくと,X ∼ Ge (0.3).よってはじめて勝つまでの平均試合数は
E(X) + 1 より
q 0.7
E(X) + 1 = + 1 = + 1 = 3.33.
p 0.3
問題解答 4.5
1. X を当たりくじの数とおくと,X ∼ Hg (10, 4, 3).よって 3 本くじを引いて,そのうち 2 本が当たる確率は
(4)(6)
3
Pr (X = 2) = 2(10)1 =
3
10
問題解答 4.6
I.
(a) X を通話時間とおくと,x ∼ Ex (λ).また E(X) = 1/λ より λ = 1/3 となるので X ∼ Ex (1/3).よって通
話が 4 分以内に終わる確率は
∫ 4 ∫ 4
−λx 1 −x/3
Pr (0 ≤ X ≤ 4) = λe dx = e dx = 1 − e4/3 .
0 0 3
Pr (2 ≤ X ≤ 6, X ≥ 2)
Pr (2 ≤ X ≤ 6|X ≥ 2) =
Pr (X ≥ 2)
∫ 6 1 −x/3
e dx e−2/3 − e−2
= ∫∞2 3
1 −x/3
= −2/3
= 1 − e−4/3 .
2 3
e dx e
問題解答 4.7
I. f (x) が密度関数になるには, ∫ ∞
f (x)dx = 1
−∞
100 第 7 章 演習問題解答
を満たす必要がある.
(a)
∫ ∞ ∫ 1 ∫ 3 ∫ ∞
f (x)dx = f (x)dx + f (x)dx + f (x)dx
∞ −∞ 1 3
∫ 3 ∫ ∞
−1
= 0+ ce {−(x − 2) + 2}dx +2
ce−(x−2) dx
1 3
[ ]3 [ ]∞
1
= ce−1 − (x − 2)3 + 2x − ce−(x−2)
3 1 3
1 1
= ce−1 (− + 6 − ( + 2)) − ce−1 (0 − (−1))
3 3
13 −1
= ce
3
3e
したがって,c = 13 .∫ 3.5
(b) P (2.5 ≤ X ≤ 3.5) = 2.5 f (x) dx
⃗ =
2. X1 を A 型の人の数,X2 を B 型の人の数,X3 を AB 型の人の数,X1 を O 型の人の数とすると,X
(X1 , X2 .X3 .X4 ) ∼ M (4, 0.35, 0.25, 0.1, 0.3).よって
4!
Pr (X1 = 1, X2 = 1, X3 = 1, X4 = 1) = (0.35)(0.25)(0.1)(0.3) = 0.063.
1!1!1!1!
3. X1 , X2 , X3 を 3 人の通話時間とおくと,X1 ∼ Ex (λ) = Γ(1, 1/λ), X2 ∼ Ex (λ) = Γ(1, 1/λ), X3 ∼ Ex (λ) =
Γ(1, 1/λ).ここで X = X1 + X2 + X3 とおくと X は 3 人の通話時間の合計を表わす.言い換えると待ち時間
を表わし,X ∼ Γ(3, 1/λ).また E(X1 ) = 1/λ = 2 より X ∼ Γ(3, 2).よって 10 分以上待たなければならない
確率は
∫ ∞
1
Pr (X ≥ 10) = 1 − Pr (0 ≤ X ≤ 10) = x2 e−x/2 dx
10 Γ(3)23
∫ 10 ∫ 10
1
= 1− x2 e−x/2 dx = 1 − [−2x2 e−x/2 |10
0 +4 xe−x/2 dx]
16 0 0
∫ 10
1
= 1− [−200e−5 + 4(−2xe−x/2 |10
0 +2 e−x/2 dx)]
16 0
1
= 1 − [−200e−5 − 80e−5 − 16e−x/2 |100 ]
16
1 296e−5
= 1 − [−296e−5 + 16] = = 0.1246
16 16
問題解答 5.1
1.
1
X̄ = (110 + 121 + 133 + 124 + 126 + 118 + 112 + 125 + 131 + 120) = 122(cm)
10
1( )
U2 = (110 − 122)2 + (121 − 122)2 + · · · + 120 − 122)2
9
= 55.111(cm)
9 2
また,S 2 = U = 49.5999 より,S = 7.043 となります.
10
101
問題解答 5.2
1 ある水域の一定区間における水質 BOD を X とおくと,X ∼ N (µ, 6.25).又,標本数は 15 で,標本平均
X = 7.2 より,
6.25
X ∼ N (µ, )
15
ここで,X を標準化すると,
X −µ 7.25 − µ
Z= √ = √
6.25 6.25
15 15
これより,
Pr (|Z| ≤ z α2 ) = 0.95
7.25 − µ
|Z| = | √ | ≤ 1.96
6.25
15
つまり √ √
6.25 6.25
7.25 − 1.96 ≤ µ ≤ 7.25 +
15 15
2 標準偏差が 2.2 より,母分散 σ 2 = 6.25 は既知である.この母集団から無作為に選んだ標本 Xi は Xi ∼
N (µ, 6.25) の正規分布に従っていると考えることができる.したがって,
X̄ ∼ N (µ, σ 2 /5)
となる.ここで,X̄ を求めると,
1 132
X̄ = [28 + 24 + 31 + 27 + 22] = = 26.4
5 5
標準化を行なうと,
X̄ − µ
Z=√ ∼ N (0, 1)
σ 2 /5
となる.95%信頼区間より,Pr (|Z| ≤ z α2 ) = 0.95. また,z 0.05 = 1.96. したがって,
2
√ √
σ2 σ2
X̄ − z α ≤ µ ≤ X̄ + z α2
2
5 5
√ √
26.4 − 1.96 6.25/5 ≤ µ ≤ 26.4 + 1.96 6.25/5
24.21 ≤ µ ≤ 28.59
X̄ ∼ N (146, σ 2 /4)
となる.ここで,X̄ を求めると,
1 582
X̄ = [145.3 + 145.1 + 145.4 + 146.2] = = 145.5
4 4
102 第 7 章 演習問題解答
母分散の推定に S ′ を用いると,
2
X̄ − µ
T =√ ∼ tn−1,α/2
S ′ 2 /4
となる.そこで,S ′ を求めると,
2
1
S′
2
= [(145.3 − 145.5)2 + (145.1 − 145.5)2 + (145.4 − 145.5)2 + (146.2 − 145.5)2 ]
3
1
= (0.04 + 0.16 + 0.01 + 0.49) = 0.23
3
となる.
95%信頼区間より,Pr (|T | ≤ tn−1,α/2 ) = 0.95. また,t3,0.005/2 = 3.18. したがって,
√ √
S′2 S′2
X̄ − t3,0.05/2 ≤ µ ≤ X̄ + t3,0.05/2
4 4
√ √
145.5 − 3.18 0.23/4 ≤ µ ≤ 145.5 + 3.18 0.23/4
144.73 ≤ µ ≤ 146.26
問題解答 5.3
108
1 標本比率は p̂ = 600 = 0.18.また,z α2 = z 0.05
2
= 1.96 であるから,上記の公式に代入すると
( √ √ )
(0.18)(0.82) (0.18)(0.82)
0.18 − 1.96 , 0.18 − 1.96
600 600
|X̄ − p|
P( √ ≤ z α2 ) = 1 − α
pqn
が成り立つ.これより, √ √
p(1 − p) p(1 − p)
X̄ − z α2 ≤ p ≤ X̄ + z α2
n n
が成り立つ.ここで,X̄ と p を p̄ で置き換えると,
√ √
p̄(1 − p̄) p̄(1 − p̄)
(p̄ − z α2 , p̄ + z α2
n n
これより, ( √ √ )
(0.2)(1 − 0.2) (0.2)(1 − 0.2)
0.2 − 1.96 , 0.2 + 1.96
900 900
1 標本比率は p̂ = 187
300 = 0.623.また,z 2 = z 2 = 1.96 であるから,十分大きな n に対して,統計量 X̄ の分
α 0.05
pq
布が正規分布 N (p, n ) で近似される.したがって,与えられた α に対して
|X̄ − p|
P( √ ≤ z α2 ) = 1 − α
pqn
が成り立つ.これより, √ √
p(1 − p) p(1 − p)
X̄ − z α2 ≤ p ≤ X̄ + z α2
n n
が成り立つ.ここで,X̄ と p を p̄ で置き換えると,
√ √
p̄(1 − p̄) p̄(1 − p̄)
(p̄ − z α2 , p̄ + z α2
n n
これより, ( √ √ )
(0.623)(1 − 0.623) (0.623)(1 − 0.623)
0.623 − 1.96 , 0.623 + 1.96
300 300
となる.次に,この日の製品が規格から外れているかの検定を行なう.
H0 : µ=7
H1 : µ ̸= 7
有意水準 α = 0.05
統計量 σ 2 が既知より,
X̄ − µ
Z= ∼ N (0, 1)
σ 2 /n
H0 のもとで,
7.09 − 7.00 4(0.09)
Z0 = √ = = 1.8
2
0.20 /16 0.2
104 第 7 章 演習問題解答
図 7.4: 正規分布
z 0.05
2
= 1.96 より,H0 を容認する.
95%信頼区間は √ √
0.202 0.202
7.09 − 1.96 ≤ µ ≤ 7.09 − 1.96
16 16
より,
6.99 ≤ µ ≤ 7.19
H0 : σ 2 = 0.0016
H1 : σ 2 > 0.0016
有意水準 α = 0.05
統計量 µ が既知で σ 2 の検定を行なうので
nS 2
χ2 = ∼ χ2α,n−1
σ2
H0 のもとで
1
S2 = [(11.97 − 12.02)2 + · · · + (12.05 − 12.028)2 ] = 0.0021
8
8(0.0021)
χ20 = = 10.5
0.0016
χ20 > χ20.05,7 = 14.07
となり,H0 は棄却される.
105
図 7.5: χ 2 乗分布
95%信頼区間は
0.0168
χ21−0.05/2,8−1 ≤ ≤ χ0.05/2,8−1
σ2
より,
0.0168
1.690 ≤ ≤ 16.01
σ2
0.0010 ≤ σ 2 ≤ 0.0099
問題解答 6.2
1
2
nA = 10, X̄ = 82, SA = 54.41
2
nB = 12, Ȳ = 76, SB = 59.17
ただし,
2 2
nA SA + nB SB
σ̂ 2 =
nA + nB − 2
H0 のもとで,
82 − 76 6
T0 = √ =√ = 1.77
62.7/10 + 62.7/12 6.27 + 5.23
t0.05/2,20 = 2.23 より,
T0 = 1.77 < t0.05/2,20 = 2.09
したがって,H0 は棄却されない.
II.
2 ′ 2
nA = 10, X̄ = 82, SA = 54.41, SA = 60.44
2 ′ 2
nB = 12, Ȳ = 76, SB = 59.17, SB = 64.53
H0 のもとで,
したがって,H0 を容認.
問題解答 6.4
1
H0 : 「ポワソン分布 P (λ) に従っている」
有意水準 α = 0.05
統計量
この表をポワソン分布とみて,死亡数の理論値を求める.これがポワソン分布 P (λ) によるものと考えて,λ
の値を推定する.死亡者数 k のときの確率を pk とすると,
∞
∑
kpk = E(X) = λ
k=0
死亡者数 k 0 1 2 3 4 計
部隊数 fk 142 99 46 11 2 300
kfk 0 99 92 33 8 232
pk 0.473 0.33 0.153 0.036 0.0066
理論度数 mk 141.9 99 45.9 10.8 1.98
∑
ここで,npk ≈ fk より k kfk ≈ λn.これより平均値 λ は
1∑ 232
λ≈ kfk = = 0.77
n 300
k
死亡者数 k 0 1 2 3 4 計
部隊数 fk 142 99 46 11 2 300
理論度数 mk 141.9 99 45.9 10.8 1.98
∑
3
(xi − mi )2
χ2 =
i=0
mi
108 第 7 章 演習問題解答
H0 のもとで,
したがって,H0 を容認.
母数 λ が標本から 1 個推定されたので,自由度は 3 − 1 − 1 = 1 となる.
2
H0 : 「飲酒と喫煙とは独立である.
」
H1 : 「飲酒と禁煙とは独立ではない.」
有意水準 α = 0.05
統計量
∑
350
(Xij − nPij )2
χ2 =
i=1
nPij
H0 のもとで,