saitei.net

2016年センター試験数学2B「確率・統計」は二項分布と母比率の推定

はじめに

センター試験数学2Bの選択問題は「数列」「ベクトル」「確率・統計」から2題を選択するが「確率・統計」が一番簡単だ。
確率・統計の主なテーマは

  1. 母平均の推定
  2. 母比率の推定
  3. 二項分布

の三つであるが(三つしかない!),昨年は母平均の推定がテーマ(しかしそれが分からなくても16点取れた!)であった。

そしたら,今年は二項分布と母比率の推定が出題された。なんと分かりやすい出題!\(^O^)/

今回は2016年の「確率・統計」を解説する。

2016年センター試験数学2B第5問「確率・統計」の問題と解説

導入と(1)〜配点5点

\(n\)を自然数とする。原点Oから出発して数直線上を\(n\)回移動する点Aを考える。
点Aは,1回ごとに,確率\(p\)で正の向きに3だけ異動し,確率\(1-p\)で負の向きに1だけ移動する。ここで,\(0<p<1\)である。
\(n\)回移動した後の点Aの座標を\(X\)とし,\(n\)回の移動のうち正の向きの移動の回数を\(Y\)とする。
以下の問題を解答するにあたっては,必要に応じて29ページの正規分布表を用いてもよい。

「29ページの正規分布表」は後で見せます。(1)には使いません。以下,黄色い背景の部分が解答・解説です。

(1) \(\displaystyle p=\frac13\),\(n=2\)のとき,確率変数\(\displaystyle X\)のとり得る値は,小さい順に
\[-[ア],[イ],[ウ]\]
であり,これらの値をとる確率はそれぞれ
\[
\frac{[エ]}{[オ]}\ ,\frac{[カ]}{オ}\ ,\frac{[キ]}{オ}\
\]
である。

簡単な確率の問題だ。\(X\)のとり得る値は小さい順に
\[-1-1=-[2]\]
\[-1+3=3-1=[2]\]
\[3+3=[6]\]
それぞれの確率は
\[(1-p)^2 = \left(\frac23\right)^2 =\frac{[4]}{[9]}\]
\[2p(1-p)=2\cdot \frac13 \cdot \frac23 =\frac{[4]}{9}\]
\[p^2 = \left(\frac13\right)^2 =\frac{[1]}{9}\]
ここまでで5点。簡単だ。

(2)〜配点5点

(2) \(n\)回移動したとき,\(X\)と\(Y\)の間に
\[X=[ク]n +[ケ]Y\]
の関係が成り立つ。

\(n\)回のうち正の向きに3だけ移動するのが\(Y\)回なので,負の向きに1だけ移動するのは\(n-Y\)回であるから
\[X=3Y -(n-Y)= [-]n +[4]Y\]

確率変数\(Y\)の平均(期待値)は[コ],分散は[サ]なので,\(X\)の平均は[シ],分散は[ス]である。[コ]〜[ス]に当てはまるものを,次の〔0〕〜〔b〕から一つずつ選べ。ただし,同じものを繰り返し選んでもよい。

〔0〕\(np\) 〔1〕\(np(1-p)\) 〔2〕\(\displaystyle \frac{p(1-p)}n\)
〔3〕\(2np\) 〔4〕\(2np(1-p)\) 〔5〕\(\displaystyle p(1-p)\)
〔6〕\(4np\) 〔7〕\(4np(1-p)\) 〔8〕\(\displaystyle 16np(1-p)\)
〔9〕\(4np-n\) 〔a〕\(4np(1-p)-n\) 〔b〕\(\displaystyle 16np(1-p)-n\)
この設問は二項分布に関する問題だ。
\(Y=k\quad (k=0,1,2,\cdots , n)\)となる確率\(P(Y=k)\)は
\[
P(Y=k)= {}_n C_k p^{k}(1-p)^{n-k}
\]
となるから,\(Y\)は二項分布\(B(n,p)\)に従う。二項分布の公式から,\(Y\)の平均\(E(Y)\)と分散\(V(Y)\)は
\[
E(Y)=np \quad つまり[コ]は[0]
\]
\[
V(Y)=np(1-p)\quad つまり[サ]は[1]
\]一般に,定数\(a\),\(b\)に対して
\[
(公式)\quad E(aY+b)=aE(Y)+b,\quad V(aY+b)=a^2 V(Y)
\]
となる。
これと\(X=4Y-n\)から,\(X\)の平均\(E(X)\)と分散\(V(X)\)は
\[
E(X)=E(4Y-n)=4E(Y)-n = 4np -n \quad つまり[シ]は[9]
\]
\[
V(X)=V(4Y-n)=16V(Y) = 16np(1-p) \quad つまり[ス]は[8]
\]
これで5点。確率・統計を勉強していれば絶対取れるレベルの設問だ。

(3)〜配点6点

(3) \(\displaystyle p=\frac14\)のとき,1200回移動した後の点Aの座標\(X\)が120以上になる確率の近似値を求めよう。

(2)により,\(Y\)の平均は[セソタ],標準偏差は[チツ]であり,求める確率は次のようになる。
\[
P(X\geq 120)=P\left(\frac{Y-セソタ}{チツ}\quad \geq [テ].[トナ]\right)
\]

(2)で\(n=1200\),\(\displaystyle p=\frac14\)の場合であるから,\(Y\)の平均\(E(Y)\)と分散\(V(Y)\)は
\[
E(Y)=1200\cdot \frac14 =[300]
\]
\[
V(Y)=1200\cdot \frac14 \left(1-\frac14\right)=1200\cdot \frac14 \cdot \frac34=\frac{3600}{16}
\]
\(Y\)の標準偏差は\(\displaystyle \sqrt{V(Y)}\)であるから
\[
\sqrt{V(Y)}=\sqrt{\frac{3600}{16}}= \frac{60}4=[15]
\]\(X=4Y-n=4Y-1200\)であるから
\begin{align*}
X\geq 1200 &\iff 4Y-1200 \geq 120 \\
&\iff Y\geq 330\\
&\iff \frac{Y-300}{15}\geq [2].[00]
\end{align*}

いま,標準正規分布に従う確率変数を\(Z\)とすると,\(n=1200\)は十分大きい
ので,求める確率の近似値は正規分布表から次のように求められる。
\[
P(Z\geq テ.トナ)=0.[ニヌネ]
\]

\(Y\)が二項分布\(B(1200,\frac14)\)に従い,1200が十分大きいので
\[
Z=\frac{Y-E(Y)}{\sqrt{V(Y)}}=\frac{Y-300}{15}
\]
とおくと,\(Z\)は標準正規分布に従う。これが誘導の意味だ。つまり,「二項分布は標準正規分布を利用して調べられるのだったよね」と問題文が示唆しているのだ。親切!
しかも,このこと全然知らなくても,すでに
\[[テ].[トナ]=[2].[00]\]
が求まっているから,正規分布表から
\[P(Z\geq 2.00)=0.[ニヌネ]\]
を読み取ればよいのだ。これで点数が取れなかったらおかしいだろう。(^_^;)
解答に戻ろう。以上から
\[
X\geq 120 \iff Z=\frac{Y-300}{15} \geq 2.00
\]
となり,正規分布表から確率\(P(Z\geq 2.00)\)を求めればよい。
これは次の図の赤い斜線部の面積\(S\)である。(曲線は標準正規分布の分布曲線)
ss 2016-08-26 23.22.52
\(S\)は次のようにして求める。

  • step1.  次の斜線部の面積は「全事象の確率」なので1である。
    ss 2016-08-26 23.23.01
    この斜線部の\(y\)軸より右側の部分(次図)の面積\(S_1\)は,その半分で0.5である。
    ss 2016-08-26 23.23.09
  • step2. \(S\)は\(S_1\)から次の図の斜線部\(S_2\)を引いたものである。
    ss 2016-08-26 23.23.18
    \(S_2\)は次の正規分布表(問題冊子のp.29にあるもの。赤い部分は私が書き込んだ。「確率分布と統計的な推測」には至る所にこんなのを載せた。(^^))から
    \[S_2=0.4772\]
    と分かる。
    169826-dist1
  • step3. よって
    \[S=S_1 – S_2 =0.5-0.4772=0.0228=0.[023]\]

これで6点。ここまでの16点は確率・統計を勉強していたら確実に取れる。

(4)〜配点4点。問題文がちょっとおかしい(^_^;)

(4) \(p\)の値が分からないとする。2400回移動した後の点Aの座標が\(X=1440\)のとき,\(p\)に対する信頼度95%の信頼区間を求めよう。
\(n\)回移動したときに\(Y\)がとる値を\(y\)とし,\(\displaystyle r=\frac y n\)とおくと,(注.赤くしたのは筆者) \(n\)が十分大きいならば,確率変数\(\displaystyle R=\frac Y n\)は近似的に平均\(p\),分散\(\displaystyle \frac{p(1-p)}n\)の正規分布に従う。

\(n=2400\)は十分大きいので,このことを利用し,分散を\(\displaystyle \frac{r(1-r)}n\)で置き換えることにより,(注.赤くしたのは筆者)求める信頼区間は
\[
0.[ノハヒ]\leq p \leq 0.[フヘホ]
\]
となる。

\(p\)を母比率と言い,この設問は「母比率の推定」と言うテーマだ。
「\(p\)に対する信頼度95%の信頼区間」すなわち「\(A\leq p \leq B\)となる確率が95%\(\displaystyle =0.95\)となる区間\(A\leq p\leq B\)」
を求めるという問題だ。
しかも,問題文の
「\(\displaystyle n\)が十分大きいならば,確率変数\(\displaystyle R=\frac Y n\)は近似的に平均\(p\),分散\(\displaystyle \frac{p(1-p)}n\)の正規分布に従う」
と言う部分は,母比率の推定の仕方を教えてくれているのだ。なんて親切なんだろう。
ただし,問題文で赤くした

 「\(n\)回移動したときに\(Y\)がとる値を\(y\)とし,\(\displaystyle r=\frac y n\)とおくと,」

と言う部分はそこにあるのはおかしい。\(\displaystyle R=\frac Y n\)が正規分布に従うとしてよい理由は「\(n\)が十分大きい」であり, 「\(\displaystyle r=\frac y n\)とおく」は全然関係ないからだ。よって,文章が破綻している。

この部分は,後の

 「分散を\(\displaystyle \frac{r(1-r)}n\)で置き換えることにより,」

の\(r\)の説明であるから,この前か付近にあるべきだ。誰も校正で気づかなかったのかな。(^_^;)

さて,問題は次の手順で解く。

    • step1. \(X=1440\)から\(y\)と\(r\)を求める。
      \(n=2400\)と\(X=4y-n\)より
      \[
      1440=4y -2400
      \]
      \[
      よって,y=960
      \]
      \[よって,r=\frac y n =\frac{960}{2400}=\frac2 5\]
    • step2. 正規分布に近似的に従う\(R\)から,標準正規分布に従う\(Z\)を以下のように作る。
      \(R\)の分散は
      \[
      \frac{r(1-r)}n =\frac{\frac25 \cdot \frac3 5}{2400}=\frac1{10000}
      \]
      よって,標準偏差は
      \[
      \sqrt{分散}=\sqrt{\frac1{10000}}=\frac1{100}=0.01
      \]
      さらに\(R\)の平均は\(p\)であり,\(R\)が近似的に正規分布に従うので
      \[
      Z=\frac{R-(Rの平均)}{(Rの標準偏差)}\quad =\frac{R-p}{0.01}
      \]
      とおくと,\(Z\)は標準正規分布に従う。
    • step3.  確率\(P(-z_0 \leq z \leq z_0)\)が95%になるような\(z_0\)を正
      規分布表から読み取る。
      \(P(-z_0 \leq z \leq z_0)\)は次の図の斜線部の面積である。
      ss 2016-08-27 8.28.54
      標準正規分布の分布曲線は\(y\)軸について対称なので,上の図の面積は次の図の斜線部の面積\(P(0\leq z \leq z_0)\)の2倍である。
      ss 2016-08-27 8.35.09
      よって\(P(-z_0 \leq z\leq z_0)=2P(0\leq z \leq z_0)\)となり,これが95%\(=0.95\)となるのは
      \[
      P(0\leq z\leq z_0)=\frac{0.95}2 =0.475
      \]
      となるときであり,次の正規分布表から
      \[
      z_0=1.96
      \]
      と分かる。
      160826-dist2
    • step4. 従って,\(-1.96 \leq z \leq 1.96\)となる確率が95%であるから,この区間を\(p\)の区間に書き直す。すなわち
      \[
      z=\frac{R-p}{0.01}と,R=r=\frac 2 5=0.4
      \]
      を用いて
      \begin{align*}
      &-1.96 \leq z \leq 1.96\\
      \iff & -1.96 \leq \frac{0.4-p}{0.01} \leq 1.96\\
      \iff & -0.0196 \leq 0.4 -p \leq 0.0196 \\
      \iff & 0.3804 \leq p \leq 0.4196
      \end{align*}
      つまり,
      \[
      0.[380]\leq p \leq 0.[420]
      \]
      となる確率が95%である。これが\(p\)に対する信頼度95%の信頼区間である。

これで4点で,お終い。
手順は長く見えるが,信頼区間の求め方の基本そのものなので慣れれば簡単だ。

まとめ

通常の数列やベクトルの問題に比べれば,「初めて見るような問題だから解法に迷う」と言う部分が全然ない。
特に,(3)の「二項分布を標準正規分布に帰着させて調べる方法を知らなくても6点やるぜ」は有り難い。高校で教えない分野だから受験者が基本的に独学であることに配慮してくれているのだろう。\(^O^)/

  • ピックアップ
  • Category

この記事は参考になりましたか?

0
コメント0件
URL :
TRACKBACK URL :

Leave a reply

*
*
* (公開されません)

CAPTCHA


Return Top