saitei.net

2017年センター試験追試数2B第5問「確率・統計」は良問

2017年センター試験追試数2B第5問「確率・統計」は良問

はじめに

2017年センター試験追試での数学2の選択問題第5問「確率・統計」を解説する。物議を呼んだ本試の「確率・統計」と異なり,教育的な良問だ。

問題を見ていない人が大半であろうからまずは問題を見てもらおう。

2017年センター試験追試数学2B第5問「確率・統計」の問題

\(0 < p < 1\)とする。袋の中に白球が\(p\),赤球が\(1-p\)の割合で,全部で\(m\)個入っているとする。

以下の問題を解答するにあたっては,必要に応じて29ページの正規分布表を用いてもよい。

(1) \(\displaystyle p=\frac35\)とする。この袋の中から1個の球を取り出し袋の中へ戻すという試行を4回繰り返すとき,白球の出る回数を\(W\)とする。
\(W\)の平均(期待値)は\(\displaystyle \frac{[アイ]}{[ウ]}\) ,\(W\)の分散は\(\displaystyle \frac{[エオ]}{[カキ]}\) である。

さらに
$$
X=(白球の出る回数)-(赤球の出る回数)
$$
とするとき
$$
X=[ク]W-[ケ]
$$
が成り立つ。このことを利用して,\(X\)の平均は\(\displaystyle \frac{[コ]}{[サ]}\),\(X\)の分散は\(\displaystyle \frac{[シス]}{[セソ]}\) であることがわかる。

(2) \(\displaystyle m=10\),\(\displaystyle p=\frac{3}{5}\)とする。
この袋の中から同時に4個の球を取り出すとき,白球の個数を表す確率変数を\(Y\)とする。このとき
$$
P(Y=0)=\frac{[タ]}{[チツテ]} ,P(Y=1)=\frac{[ト]}{[ナニ]}
$$
である。同様に\(Y\)のとり得る他の値に対する確率を求めてから,\(Y\)の平均を計算すると\(\displaystyle \frac{[ヌネ]}{[ノ]}\) であることがわかる。

(3) 以下では\(p\)の値がわからないとする。

この袋の中から1個の球を取り出し袋の中に戻すという試行を\(n\)回繰り返す(以下,これを\(n\)回の復元抽出という)。
\(n\)回の復元抽出を行ったとき,白球の出る回数を確率変数\(W\)で表し,\(\displaystyle R=\frac W n\)とおく。
\(n\)が十分大きいとき,確率変数\(R\)は近似的に平均\(p\),分散\(\displaystyle \frac{p(1-p)}n\)の正規分布に従う。
\(W\)のとる値を\(w\)とし,\(\displaystyle r=\frac w n\)とおくと,\(R\)が近似的に従う正規分布の分散\(\displaystyle \frac{p(1-p)}n\)を\(\displaystyle \frac{r(1-r)}n\)で置き換える事により,\(p\)に対する信頼度(信頼係数)95%の信頼区間\(A\leq p \leq B\)を求めることができる。このとき,\(B-A\)を信頼区間の幅とよぶ。以下,信頼度95%を固定して考え,\(n\)は十分大きいとする。

\(n\)回の復元抽出を行って信頼区間を作るとき,信頼区間の幅が最大となる\(r\)の値は\(r=0.[ハ]\)が得られたときである。このときの信頼区間の幅を\(L_1\)とする。
また,\(n\)回の復元抽出を行って,\(r=0.8\)が得られたときの信頼区間の幅を\(L_2\)とする。このとき,\(\displaystyle \frac{L_2}{L_1}=[ヒ].[フ]\)である。

normal dist.

解答と解説

以下,黄色い背景の部分が解答・解説です。

(1)二項分布の基本/配点10点

\(0< p<1\)とする。袋の中に白球が\(p\),赤球が\(1-p\)の割合で,全部で\(m\)個入っているとする。

以下の問題を解答するにあたっては,必要に応じて29ページの正規分布表を用いてもよい。

(1) \(\displaystyle p=\frac35\)とする。この袋の中から1個の球を取り出し袋の中へ戻すという試行を4回繰り返すとき,白球の出る回数を\(W\)とする。
\(W\)の平均(期待値)は\(\displaystyle \frac{[アイ]}{[ウ]}\) ,\(W\)の分散は\(\displaystyle \frac{[エオ]}{[カキ]}\) である。

二項分布の公式を用いるだけの問題だ。本試より数値が簡単だ。

二項分布の公式から,\(W\)の平均\(E(W)\)と分散\(V(W)\)は
\[
E(W) =4\cdot \frac3 5=\frac{[12]}{[5]}
\]
\[
V(W) =4\cdot \frac 3 5 \left(1-\frac3 5\right)=\frac{[24]}{[25]}
\]

これで各2点。穏やかな出だし。

さらに
$$
X=(白球の出る回数)-(赤球の出る回数)
$$
とするとき
$$
X=[ク]W-[ケ]
$$
が成り立つ。このことを利用して,\(X\)の平均は\(\displaystyle \frac{[コ]}{[サ]}\),\(X\)の分散は\(\displaystyle \frac{[シス]}{[セソ]}\) であることがわかる。

4回のうち,白球が\(W\)回出て,赤球は\(4-W\)回出るのだから
\[
X=W-(4-W)=[2]W-[4]
\]このことから,\(X\)の平均\(E(X)\)と分散\(V(X)\)は
\[
E(X)=E(2W-4)=2E(W)-4
\]
\[
=2\cdot \frac{12}5 -4 =\frac{[4]}{[5]}
\]
\[
V(X)=V(2W-4)=V(2W)
\]
\[
=2^2 V(W)=4\cdot \frac{24}{25}=\frac{[96]}{[25]}
\]

これで6点。変数変換した場合の平均,分散の公式を当てはめるだけ。本試よりずっと簡単。追試が本試より簡単とはなかなかないよ。

追試の他の選択問題を見れば第3問「数列」はなんと係数に\(n\)が入った3項間漸化式。3項間漸化式は指導要領の範囲外だぞ。理系の2次試験では黙認状態(理系が3項間漸化式ぐらい解けないと大学で困る)だけど,誘導を付けているとは言え,センターで出すかね。
「追試は本試で使えないクソ問題」とオレは思っているが,その典型例だ。本試の数列がこんな問題だったら暴動が起きるぞ。

追試の第4問「ベクトル」は空間ベクトルでなかなか気合いが入った問題。最初の小問から9つの選択肢から選ぶというものだ。やはり本試より難しい。

結局「確率・統計」だけが本試と追試の難易度が逆転している。

(2)簡単な確率と平均/配点6点

(2) \(\displaystyle m=10\),\(\displaystyle p=\frac{3}{5}\)とする。
この袋の中から同時に4個の球を取り出すとき,白球の個数を表す確率変数を\(Y\)とする。このとき
$$
P(Y=0)=\frac{[タ]}{[チツテ]} ,P(Y=1)=\frac{[ト]}{[ナニ]}
$$
である。同様に\(Y\)のとり得る他の値に対する確率を求めてから,\(Y\)の平均を計算すると\(\displaystyle \frac{[ヌネ]}{[ノ]}\) であることがわかる。

数Aの確率の問題としても易しい。数Aの確率との違いは平均が入っている事だけ。

\(m=10\),\(\displaystyle p=\frac 3 5\)とは,10個の球のうち白球が\(\displaystyle 10\cdot \frac 3 5=6\)個,赤球が\(10-6=4\)個ということだ。

10個の球から同時に4個とり出す方法は全部で\(\displaystyle {}_{10}C_4=\frac{10\cdot 9\cdot 8\cdot 7}{4\cdot 3\cdot 2\cdot 1}=210\)通り。

\(Y=0\)となるのは4個とも赤球を取る1通りであるから,
\[
P(Y=0)=\frac{[1]}{[210]}
\]

\(Y=1\)となる取り方は「白球が1個,赤球が3個」であるから
\[
6\cdot {}_4 C_{3}=24通り
\]

よって
\[
P(Y=1)=\frac{24}{210}=\frac{[4]}{[35]}
\]

「同様に\(Y\)のとり得る他の値に対する確率を求めてから,\(Y\)の平均を計算すると」と書いてあるがそんなことしなくても「1個取るときの白球の個数の平均が\(\displaystyle p=\frac 3 5\)個」なのだから,4個取るときはその4倍となり
\[
E(Y)=4\cdot \frac 3 5 =\frac{[12]}{[5]}
\]

これで6点。あっという間だ。

(3)母比率の推定/配点4点

(3) 以下では\(p\)の値がわからないとする。

なんとここから標本比率\(r\)から母比率\(p\)を正規分布を利用して推定する方法の解説が始まる。親切!

この袋の中から1個の球を取り出し袋の中に戻すという試行を\(n\)回繰り返す(以下,これを\(n\)回の復元抽出という)。
\(n\)回の復元抽出を行ったとき,白球の出る回数を確率変数\(W\)で表し,\(\displaystyle R=\frac W n\)とおく。
\(n\)が十分大きいとき,確率変数\(R\)は近似的に平均\(p\),分散\(\displaystyle \frac{p(1-p)}n\)の正規分布に従う。
\(W\)のとる値を\(w\)とし,\(\displaystyle r=\frac w n\)とおくと,\(R\)が近似的に従う正規分布の分散\(\displaystyle \frac{p(1-p)}n\)を\(\displaystyle \frac{r(1-r)}n\)で置き換える事により,\(p\)に対する信頼度(信頼係数)95%の信頼区間\(A\leq p \leq B\)を求めることができる。このとき,\(B-A\)を信頼区間の幅とよぶ。以下,信頼度95%を固定して考え,\(n\)は十分大きいとする。

ようやく解説が終わりました。ここから実際の作業に入る。

\(n\)回の復元抽出を行って信頼区間を作るとき,信頼区間の幅が最大となる\(r\)の値は\(r=0.[ハ]\)が得られたときである。このときの信頼区間の幅を\(L_1\)とする。

以上の解説にあるように,\(R\)は平均が\(p\),分散が\(\displaystyle \sigma^2 = \frac{r(1-r)}n\)の正規分布に近似的に従う。
\[
z=\frac{R-p}{\sigma}\quad \left( ただし,\sigma =\sqrt{\frac{r(1-r)}n}\right)
\]
とおくと,\(z\)は標準正規分布に従う。「95%の信頼区間」を求めるには
\[
P(-z_0\leq z \leq z_0)=0.95 \quad (=95%)
\]
となる\(z_0\)を正規分布表から求める・・・というおなじみの作業を行う。

\[
2P(0\leq z \leq z_0)=P(-z_0\leq z \leq z_0)=0.95
\]
より
\[
P(0\leq z \leq z_0)=0.475
\]

「29ページの正規分布表」から次の図のようにして
\[
z_0= 1.96
\]

したがって
\[
-z_0\leq z=\frac{R-p}{\sigma} \leq z_0
\]
となる確率が95%であり,これを変形し\(p\)に対する信頼度95%の信頼区間とは
\[
\underbrace{R-z_0 \sigma}_{これがA} \leq p \leq \underbrace{R+z_0 \sigma}_{これがB}
\]
(\(A\)や\(B\)そのものが欲しいときは\(R\)に標本比率\(r\)の値を代入するが,本問ではそのままでよい。)

よって,信頼区間の幅は
\[
B-A=2z_0 \sigma =2z_0\sqrt{\frac{r(1-r)}n} \qquad \cdots (☆)
\]
となる。(ただし,\(z_0=1.96\))

\(z_0\)と\(n\)が定数であるから,\(B-A\)を最大にするには
\[
r(1-r)=-\left(r-\frac12\right)^2 +\frac14
\]
を最大にすればよく,
\[
r=\frac12 =0.[5]
\]
のときである。ここまでで2点だが,正規分布表の使い方を勉強していれば一瞬だろう。(結果から言うと\(z_0\)の値は使わないから,正規分布表の使い方を知らなくてもいいのだ。ひえー)

このとき,(☆)から
\[
L_1= B-A= 2z_0\sqrt{\frac{0.5^2}n}
\]

また,\(n\)回の復元抽出を行って,\(r=0.8\)が得られたときの信頼区間の幅を\(L_2\)とする。このとき,\(\displaystyle \frac{L_2}{L_1}=[ヒ].[フ]\)である。

\(r=0.8\)のとき,(☆)から
\[
L_2=B-A =2z_0 \sqrt{\frac{0.8\cdot 0.2}n}
\]したがって
\[
\frac{L_2}{L_1}=\sqrt{\frac{0.8\cdot 0.2}{0.5^2}}=\sqrt{\frac{16}{25}}=\frac45 =[0].[8]
\]

これで2点。結局正規分布表を使うは最後の4点だけなので,正規分布表を勉強していなくても16点があっという間に取れる。

終わりに

追試の方がセンター試験らしい標準的な良い問題だよね。

この記事は参考になりましたか?

0
コメント0件
URL :
TRACKBACK URL :

Leave a reply

*
*
* (公開されません)

CAPTCHA


Return Top