saitei.net

2019年センター2B第5問「確率・統計」は数列やベクトルより簡単

2019年センター2B第5問「確率・統計」は数列やベクトルより簡単

【2019年1月21日投稿。2019年3月22日若干修正】

はじめに

2019年センター試験本試での数学2Bの選択問題第5問「確率・統計」を解説する。難化した数列や,久しぶりに空間図形を扱ったベクトルより,ずっと解きやすかったはずだ。

数Iのデータの分析にも「確率・統計」の次のような知識を要求する問題が出たから,確率・統計を勉強した者は数Iで有利だったと思う。

  • 確率変数\(X\)を\(\displaystyle z=\frac{X-E(X)}{\sigma (X)}\)と正規化すると,\(z\)の平均は0であり標準偏差は1。
  • この\(z\)はだいたい\(-3\)から3ぐらいの値をとることが多い。「\(-1\)から1」などとなるのは異常。

こんなのを数I「データの分析」で出したらダメだろ。

問題を見ていない人が大半であろうからまずは問題を見てもらおう。

2018年センター試験追試数学2B第5問「確率・統計」の問題

以下の問題を解答するにあたっては,必要に応じて29ページの正規分布表を用いてもよい。

(1) ある食品を摂取したときに,血液中の物質Aの量がどのように変化するか調べたい。食品摂取前と摂取してから3時間後に,それぞれ一定量の血液に含まれる物質Aの量(単位はmg)を測定し,その変化量,すなわち摂取後の量から摂取前の量を引いた値を表す確率変数を\(X\)とする。\(X\)の期待値(平均)は\(E(X)=-7\),標準偏差は\(\sigma(X)=5\)とする。

このとき,\(X^2\)の期待値は\(E(X^2)= [アイ]\quad \)である。

また,測定単位を変更して\(W=1000X\)とすると,その期待値は\(E(W)= -7 \times 10^{[ウ]}\quad \),分散は\(V(W)=5^{[エ]}\times 10^{[オ]}\quad \)となる。

(2) (1)の\(X\)が正規分布に従うとするとき,物質Aの量が減少しない確率\(P(X \geq 0)\)を求めよう。この確率は
$$ P(X\geq 0)= P\left(\frac{X+7}5 \geq [カ].[キ]\right)$$
であるので,標準正規分布に従う確率変数を\(Z\)とすると,正規分布表から,次のように求められる。
$$P(Z\geq [カ].[キ])=0.[クケ]\quad \cdots\cdots\cdots\cdots 《1》 $$

無作為に抽出された50人がこの食品を摂取したときに,物質Aの量が減少するか,減少しないかを考え,物質Aの量が減少しない人数を表す確率変数を\(M\)とする。\(M\)は二項分布\(B(50, 0.[クケ])\quad \)に従うので,期待値は\(E(M)=[コ].[サ]\quad \),標準偏差は\(\sigma(M)=\sqrt{[シ].[ス]}\quad \)となる。ただし,0.[クケ]は《1》で求めた少数第2位までの値とする。

(3) (1)の食品摂取前と摂取してから3時間後に,それぞれ一定量の血液に含まれる別の物質Bの量(単位はmg)を測定し,その変化量,すなわち摂取後の量から摂取前の量を引いた値を表す確率変数を\(Y\)とする。\(Y\)の母集団分布は母平均\(m\),母標準偏差6をもつものとする。\(m\)を推定するため,母集団から無作為に抽出された100人に対して物質Bの変化量を測定したところ,標本平均\(\bar Y\)の値は\(-10.2\)であった。

このとき,\(\bar Y\)の期待値は\(E(\bar Y)=m\),標準偏差は\(\sigma(\bar Y)= [セ].[ソ]\quad \)である。\(\bar Y\)の分布が正規分布で近似できるとすれば,\(\displaystyle Z=\frac{\bar Y -m}{[セ].[ソ]}\quad\)は近似的に標準正規分布に従うと見なすことができる。

正規分布表を用いて\(|Z|\leq 1.64\)となる確率を求めると\(0.[タチ]\quad\)となる。このことを利用して,母平均\(m\)に対する信頼度タチ%の信頼区間,すなわち,タチ%の確率で\(m\)を含む信頼区間を求めると,[ツ]となる。[ツ]に当てはまる最も適当をものを,次の【0】〜【3】のうちから一つ選べ。

\(【0】\ -11.7 \leq m \leq -8.7\)
\(【1】\ -11.4 \leq m \leq -9.0\)
\(【2】\ -11.2 \leq m \leq -9.2\)
\(【3】\ -10.8 \leq m \leq -9.6\)


(これがいつもの「p.29の正規分布表」)

解答と解説

以下,黄色い背景の部分が解答・解説です。

(1)期待値と分散の基本公式/配点6点

(1) ある食品を摂取したときに,血液中の物質Aの量がどのように変化するか調べたい。食品摂取前と摂取してから3時間後に,それぞれ一定量の血液に含まれる物質Aの量(単位はmg)を測定し,その変化量,すなわち摂取後の量から摂取前の量を引いた値を表す確率変数を\(X\)とする。\(X\)の期待値(平均)は\(E(X)=-7\),標準偏差は\(\sigma(X)=5\)とする。

このとき,\(X^2\)の期待値は\(E(X^2)= [アイ]\quad\)である。

数1「データの分析」で習う次の基本公式を使う。
$$(公式) \quad \underbrace{\sigma(X)^2}_{Xの分散} = E(X^2)- E(X)^2$$

ここから
$$ 5^2= E(X^2)- (-7)^2$$
$$ E(X^2)= [74]$$

これで2点。

また,測定単位を変更して\(W=1000X\)とすると,その期待値は\(E(W)= -7 \times 10^{[ウ]}\quad\),分散は\(V(W)=5^{[エ]}\times 10^{[オ]}\quad\)となる。

これは確率・統計で学ぶ次の公式を当てはめるだけだ。
$$(公式) \quad aを定数とすると,E(aX)=aE(X),\quad V(X)= a^2 V(X)$$

\(V(X)=\sigma(X)^2 = 5^2\)も利用して
$$E(W)= 1000 E(X)= -7\times 10^{[3]}$$
$$V(W)= 1000^2 V(X)=5^{[2]}\times 10^{[6]} $$

これで各2点。ここまで問題文を読むだけの時間であっという間に解けるだろう。

(2)正規分布表と二項分布の基本/配点8点

(1)の\(X\)が正規分布に従うとするとき,物質Aの量が減少しない確率\(P(X \geq 0)\)を求めよう。この確率は
$$ P(X\geq 0)= P\left(\frac{X+7}5 \geq [カ].[キ]\right)$$
であるので,標準正規分布に従う確率変数を\(Z\)とすると,正規分布表から,次のように求められる。
$$P(Z\geq [カ].[キ])=0.[クケ]\quad \cdots\cdots\cdots\cdots 《1》$$

「正規分布表はこうやって使うんですよ」という確認ですね。親切だ。
$$X\geq 0 \iff \frac{X+7}5 \geq \frac 7 5 =[1].[4]$$
となる。

標準正規分布に従う\(Z\)について確率\(P(Z\geq 1.4)\)は次の図1の斜線部の面積で表される。

図1

この\(z\)を求めるには図2の斜線部の面積0.5から,図3の斜線部の面積\(P(0\leq Z \leq 1.40)\)を引いたものである。

図2

図3

「p.29の正規分布表」から図4のようにして
$$
P(0\leq Z \leq 1.40)=0.4192
$$
とわかる。

図4

したがって
$$
P(Z\geq 1.4)=0.5 – 0.41921= 0.[08]
$$

ここまで各2点。

無作為に抽出された50人がこの食品を摂取したときに,物質Aの量が減少するか,減少しないかを考え,物質Aの量が減少しない人数を表す確率変数を\(M\)とする。\(M\)は二項分布\(B(50, 0.[クケ])\quad\)に従うので,期待値は\(E(M)=[コ].[サ]\quad\),標準偏差は\(\sigma(M)=\sqrt{[シ].[ス]}\quad\)となる。ただし,0.[クケ]は《1》で求めた少数第2位までの値とする。

ここから二項分布がテーマになる。

「\(M\)は二項分布\(B(50, 0.[08])\)に従う」というのは次のような意味だ。

  • 50人で調べるよ。
  • この食品を摂取した場合に物質Aの量が減少しない確率は,それぞれの人で0.08。
  • しかも,それは他の人と影響しあわない。
  • Aが減少しない人を\(M\)人とするよ。

でもこんなことを考えなくても「\(M\)は二項分布\(B(50, 0.[08])\)に従う」を信じて,次の公式を当てはめれば良いよね。

$$(公式) \quad Mが二項分布B(n,p)に従うとき,E(M)=np, \sigma(M)=\sqrt{np(1-p)}$$

ここから
$$E(M)=50 \times 0.08 = [4].[0]$$
$$\sigma(M)=\sqrt{50\times 0.08 \times 0.92}=\sqrt{[3].[7]}$$

これで各2点。ここまで特に引っかかるところはない。

(3)母平均の推定と信頼区間/配点6点

(3) (1)の食品摂取前と摂取してから3時間後に,それぞれ一定量の血液に含まれる別の物質Bの量(単位はmg)を測定し,その変化量,すなわち摂取後の量から摂取前の量を引いた値を表す確率変数を\(Y\)とする。\(Y\)の母集団分布は母平均\(m\),母標準偏差6をもつものとする。\(m\)を推定するため,母集団から無作為に抽出された100人に対して物質Bの変化量を測定したところ,標本平均\(\bar Y\)の値は\(-10.2\)であった。

このとき,\(\bar Y\)の期待値は\(E(\bar Y)=m\),標準偏差は\(\sigma(\bar Y)= [セ].[ソ]\quad\)である。

ここから母平均を推定するおなじみの作業になる。標本平均\(\bar Y\)の標準偏差\(\sigma(\bar Y)\)は,公式から
$$
\sigma(\bar Y)=\frac{母標準偏差}{\sqrt{標本の大きさ}}=\frac{6}{\sqrt{100}}=[0].[6]
$$

公式を当てはめただけで2点。

\(\bar Y\)の分布が正規分布で近似できるとすれば,\(\displaystyle Z=\frac{\bar Y -m}{[セ].[ソ]}\)は近似的に標準正規分布に従うと見なすことができる。

標本平均から母平均を推定する理屈を確認してくれています。親切です。

正規分布表を用いて\(|Z|\leq 1.64\)となる確率を求めると\(0.[タチ]\quad\)となる。

\(\sigma(\bar Y)\)がわからなかったとしても,ここだけ解けてしまうサービス問題。
$$
P(|Z|\leq 1.64)= P(-1.64 \leq Z \leq 1.64)
$$
は次の図5の斜線部の面積である。
図5

これは次の図6の面積\(P(0\leq Z \leq 1.64)\)の2倍だ。

図6

\(P(0\leq Z \leq 1.64)\)は,正規分布表から図7のようにして
$$
P(0\leq Z \leq 1.64)=0.4495
$$
とわかる。

図7

以上から
$$
P(|Z|\leq 1.64) = 2\times 0.4495 =0.[90]
$$

これで2点。

このことを利用して,母平均\(m\)に対する信頼度タチ%の信頼区間,すなわち,タチ%の確率で\(m\)を含む信頼区間を求めると,[ツ]となる。[ツ]に当てはまる最も適当をものを,次の【0】〜【3】のうちから一つ選べ。

\(【0】\ -11.7 \leq m \leq -8.7\)
\(【1】\ -11.4 \leq m \leq -9.0\)
\(【2】\ -11.2 \leq m \leq -9.2\)
\(【3】\ -10.8 \leq m \leq -9.6\)

以上から\(|Z|\leq 1.64\)すなわち
$$
-1.64 \leq Z = \frac{\bar Y -m}{0.6}\leq 1.64
$$
ということが確率90%で起きるとわかった。

この不等式は
$$
\bar Y -0.6\times 1.64 \leq m \leq \bar Y +0.6\times 1.64
$$
と変形でき,\(\bar Y= -10.2\)であったから
$$
-10.2 -0.6\times 1.64 \leq m \leq -10.2 +0.6\times 1.64
$$
つまり
$$
-11.2 \leq m \leq -9.2
$$
これが確率90%で起きると言うわけで,「\(m\)の信頼度90%の信頼区間」という・・・というのは確率・統計の一番重要な話。確率・統計を選択していたら知らないはずがないテーマだ。選択肢は【2】。これで2点。

終わりに

確率・統計と言うのはこういう使い方をするのだな,ということがよく分かる教育的な問題だ。数列よりもはるかに楽だ。

お願いだから,来年もこういう出題にして欲しい。

この記事は参考になりましたか?

0
コメント0件
URL :
TRACKBACK URL :

Leave a reply

*
*
* (公開されません)

CAPTCHA


Return Top