新課程から必修となった高校数学B「統計的な推測」ですが、大学入試でも東大の2次試験での出題が予告されました。
他の単元に比べて参考書も多くなく、学校の授業や教科書では不十分に感じている人も少なくないと思います。
共通テストでも出題されますので、27問の例題や解説、公式をわかりやすく説明したいと思います。定期テストや入試に向けた勉強の参考にしてください。
そもそも「統計学」とは?
![undraw_Setup_analytics_re_foim](https://akiyamath.com/wp-content/uploads/2022/12/undraw_Setup_analytics_re_foim-300x216.png)
近代統計学の理論の基礎を構築した カール・ピアソン(1857-1936)は「統計学は科学の文法である。」という言葉を残しています。統計学とは、現実に起きている様々な(自然科学に限らない)現象の法則性に着目し、その関心が生み出した学問と言えます。
そんな近代統計学の理論は、以下の二つの分野を合わせたものです。
対象となるものの全てを入念に調べて(すなわち、全数調査をして)その規則性から法則を見出だす。
「確率論」と「記述統計学」を駆使して、一部(標本)を観察して全体(母集団)の法則性を発見する。
この構成を元にして、数学Bの単元「統計的な推測」を中心に、高校数学における統計学の流れ眺めてゆきたいと思います。
記述統計学
![undraw_building_blocks_n0nc](https://akiyamath.com/wp-content/uploads/2022/11/undraw_building_blocks_n0nc-300x190.png)
記述統計学の内容は、数学I「データの分析」で扱われます。ここでは、その内容に軽く触れてゆきます。
データの整理の基礎基本
度数分布表や相対度数分布表を用いたデータの整理の仕方、それをグラフ化したヒストグラムや箱ひげ図の扱いを学びます。データの平均値、中央値、最頻値、四分位数などの代表値も計算できるようになりましょう。
データの分散と標準偏差
データの平均値周りの散らばり度合いを測る目安として、分散や標準偏差を学びます。公式を丸暗記するのではなく、結局何を計算いているのか理解することが大切です。
データの相関について
ペアになっている二つのデータの関係性について考えます。散布図を書いて直線的な関係があるか可視化したり、相関係数を用いてそれらを数値化する方法も身につけておく必要があります。
仮説検定の考え方
※記述統計かと言われるとアレですが、数学Iで扱われるのでここで言及します。例題は数学Bとして問7で紹介しています。
基礎となるのは背理法の考え方です。例えば、ある実験Aの結果「コインの面裏の出方が偏っている!」と主張したいとしましょう。そこで、偏っていないと仮定して実験Aの結果を検証します。(この仮定を \({\rm H_0}\) とします。)そこで、
- 今回の実験Aの結果が基準より低い確率で起こったと結論されるなら「そんなことはないだろう」ということで仮定 \({\rm H_0}\) を棄却します。
- 今回の実験Aの結果が基準より高い確率で起こったと結論されるなら「そうなることもあるかもね」ということで仮定 \({\rm H_0}\) を棄却されません。
はじめは「コインの面裏の出方が偏っている!」と主張したかったわけですから、仮定 \({\rm H_0}\) が棄却されれば「やっぱりな」となります。確率を使って矛盾を探すのです。
仮定 \({\rm H_0}\) が棄却されなかった場合は「『コインの面裏の出方が偏っている』とは判断できない」となります。
確率論の準備【統計的な推測 前半】
![undraw_feeling_proud_qne1](https://akiyamath.com/wp-content/uploads/2022/12/undraw_feeling_proud_qne1-300x262.png)
数学Bで扱われる項目については、対応する記事がありますので例題の紹介に留めたいと思います。
確率の基礎基本(数学Aより)
様々な事象を扱うことになりますが、その基本は数学Aで扱ったものが基本となります。コインやカード、球、くじ引きなどの基本的な確率はスムーズに求められるようにしておきましょう。
確率変数と確率分布の基本
目の数字が \(1\),\(2\),\(3\),\(3\),\(5\),\(5\) であるさいころが \(1\) 個ある。このさいころを \(2\) 回投げ、出た目の積を \(4\) で割った余りを \(X\) とする。確率変数 \(X\) の期待値を求めよ。
白球 \(2\) 個と黒球 \(4\) 個が入った袋から \(1\) 個ずつ球を取り出すことを繰り返す。但し、取り出した球は袋に戻さないものとする。\(2\) 個目の白球が取り出されたとき、その時点で取り出した球の総数を \(X\) とする。確率変数 \(X\) の期待値、分散、標準偏差を求めよ。
黒石が \(2\) 個、白石が \(n\) 個ある。これらを無作為に \(1\) 個ずつ一列に並べてゆく。このとき、\(2\) 個の黒石の間にある白石の個数を \(X\) とする。確率変数 \(X\) の期待値と分散を求めよ。
\(1\) ではない定数 \(a\) に対し、確率変数 \(X\) のとり得る値が \(\{1,a\}\) であるとする。確率変数 \(Y=3X-1\) の期待値と分散がそれぞれ \(5\) と \(9\) であるとき、\(a\) の値を求めよ。
\(1\),\(2\),\(3\) の数字を書いたカードが、それぞれ \(2\) 枚,\(3\) 枚,\(5\) 枚の計 \(10\) 枚ある。これらのカードを元に戻さず、無作為に \(1\) 枚ずつ \(2\) 回選び出す。\(1\) 回目に選んだカードの数字を \(X\) とし、\(2\) 回目に選んだカードの数字を \(Y\) とするとき、\(X\) と \(Y\) の同時分布を求めよ。
確率変数の和や積の計算
\(1\) 個のさいころを \(2\) 回連続で投げる。出た目を順に \(a\),\(b\) とするとき、\(a\) が \(3\) の倍数である事象を \(A\) とし、\(ab\) が \(25\) 未満である事象を \(B\) とする。\(A\) と \(B\) が独立か従属か判定せよ。
袋 \({\rm A}\) の中には当たり \(2\) 本とはずれ \(3\) 本のくじが、袋 \({\rm B}\) の中には当たり \(3\) 本とはずれ \(2\) 本のくじが入っている。袋 \({\rm A}\) から \(2\) 本同時に引いたときの当たりの本数を \(X\) とし、袋 \({\rm B}\) から \(2\) 本同時に引いたときの当たりの本数を \(Y\) とする。
(1)\(E(X)\) と \(E(Y)\) を求めよ。
(2)\(E(3X-2Y)\) と \(E(XY)\) を求めよ。
当たり \(4\) 本、はずれ \(12\) 本のくじから \(1\) 本引きいて元に戻す操作を \(10\) 回行う。当たりを引く回数を \(X\) とするとき、\(X\) の期待値と分散を求めよ。
\(1\) 個のさいころを \(3\) 回投げ
- \(1\) 回目に出た目を \(2\) で割った余りを \(X\)
- \(2\) 回目に出た目を \(3\) で割った余りを \(Y\)
- \(3\) 回目に出た目を \(5\) で割った余りを \(Z\)
とおく。点 \({\rm O}\) を原点とする座標空間の点 \({\rm P}\) の座標を \((X,Y,Z)\) としたとき、\({\rm OP}^2\) の期待値を求めよ。
二項分布と正規分布
\(100\) 本のうち、\(a\) 本が当たりのくじがある。このくじを無作為に \(1\) 本引き、当たりか否かを確認して元に戻す操作を \(n\) 回繰り返す。当たりを引いた回数 \(X\) の従う分布の平均が \(\displaystyle \frac{9}{5}\)、分散が \(\displaystyle \frac{36}{25}\) であるとする。このとき、\(a\) と \(n\) の値を求めよ。
袋に赤球 \(3\) 個と白球 \(17\) 個が入っている。この袋から無作為に \(1\) 個の球を取り出し、色を確認して戻す操作を \(10\) 回繰り返す。このとき、赤球が出た回数が \(k\) ならば \(50k\) 円を受け取るというゲームを考える。参加料が \(10a\) 円であるとき、参加者が損になるような自然数 \(a\) の最小値を求めよ。
確率変数 \(X\) の確率密度関数 \(f(x)\) が以下で与えられるとき、正の定数 \(a\) の値を求めよ。
\begin{align}
f(x)=\begin{cases}
ax(3-x)&(0\leq x\leq 3)\\
0&(x<0, 3<x)
\end{cases}
\end{align}
また、この確率変数 \(X\) の期待値と分散を求めよ。
ある高校の \(2\) 年生男子の身長 \(X\) が、平均 \(171.3\,{\rm cm}\)、標準偏差 \(5.0\,{\rm cm}\) の正規分布に従うものとする。このとき、以下の問に答えよ。但し、小数第 \(2\) 位を四捨五入して小数第 \(1\) 位まで求めよ。
(1)身長 \(178\,{\rm cm}\) 以上の生徒は約何%いるか。
(2)身長 \(160\,{\rm cm}\) 以上 \(170\,{\rm cm}\) 以下の生徒は約何%いるか。
(3)身長の高い方から \(5\) %の中に入るのは約何 \({\rm cm}\) 以上の生徒か。
「次の \(4\) つの選択肢のうち正しいものを \(1\) つ選べ。」という問題がある。解答者 \(1200\) 人がそれぞれ無作為に選択肢を \(1\) つずつ選ぶとする。このとき、正しい選択肢を選んだ人が \(240\) 人以上 \(315\) 人以下となる確率を求めよ。但し、小数第 \(3\) 位を四捨五入して小数第 \(2\) 位まで求めよ。
推測統計学【統計的な推測 後半】
![speed_test_wxl0](https://akiyamath.com/wp-content/uploads/2023/01/undraw_speed_test_wxl0-300x229.png)
引き続き、数学Bで扱われる項目の記事と例題をご紹介します。
母集団と標本に
有限の母集団の変量 \(x\) が以下の分布をなしているとする。
![](https://akiyamath.com/wp-content/uploads/2023/10/IMG_2099-300x155.jpg)
この母集団から復元抽出によって得られた大きさ \(20\) の無作為標本を $$X_1, X_2, \cdots, X_{20}$$ とし、その標本平均を \(\overline{X}\) とする。\(\overline{X}\) の期待値と標準偏差を求めよ。
有限の母集団 \(\{1,1,2,3\}\) から非復元抽出によって得られた大きさ \(2\) の標本 \((X_1,X_2)\) を考える。このとき、標本平均 \(\displaystyle \overline{X}=\frac{X_1+X_2}{2}\) の確率分布を求めよ。
\(1\) 個のさいころを \(1000\) 回投げる。このとき、出る目の平均 \(\overline{X}\) の期待値と標準偏差を求めよ。
ある県において、新生児の男子と女子の割合は等しいことが知られている。ある年の新生児の中から無作為に \(n\) 人抽出するとき、\(k\) 番目の新生児が男なら \(1\)、女なら \(0\) を対応させる確率変数を \(X_k\) とする。
(1)標本平均 \(\overline{X}\) の期待値 \(E(\overline{X})\) を求めよ。
(2)標本平均 \(\overline{X}\) の標準偏差 \(\sigma(\overline{X})\) を \(0.04\) 以下にするためには、標本の大きさ \(n\) はいくつ以上にする必要があるか。
標本平均の分布と正規分布
ある市において、市議会議員選挙の投票率は例年 \(50\)%であることがわかっている。ある選挙後、市民から無作為に \(100\) 人抽出するとき、投票に行った割合を \(R\) とする。
(1)標本比率 \(R\) の期待値 \(E(R)\) と標準偏差 \(\sigma(R)\) を求めよ。
(2)標本比率 \(R\) が \(41\) %以上 \(50\) %以下である確率を求めよ。
体重が \(8.0\,{\rm kg}\)、標準偏差 \(0.4\,{\rm kg}\) の正規分布に従う生物集団があるとする。
(1)体重が \(7.2\,{\rm kg}\) から \(8.4\,{\rm kg}\) までのものは全体の何%であるか。
(2)\(4\) つの個体を無作為に取り出したとき、体重の標本平均が \(5.2\,{\rm kg}\) 以上となる確率を求めよ。
当たりが \(1\) 本、はずれが \(7\) 本のくじを考える。このくじを \(1\) 本引いて元に戻す操作を \(n\) 回繰り返したとき、当たりが出る相対度数を \(R\) とする。このとき、確率 $$P\left(\left|R-\frac{1}{8}\right|\leq\frac{1}{40}\right)$$ の値を、\(n=175,700,1575\) それぞれに対して求めよ。
母平均の推定・母比率の推定
ある工場から出荷された塩の袋の中から無作為に \(100\) 個を抽出したところ、質量の平均は \(500.7\,{\rm g}\) であった。質量の母標準偏差を \(9.8\,{\rm g}\) として、\(1\) 袋あたりの質量の平均値を信頼度 \(95\)%で推定せよ。
ある正方形の \(1\) 辺の長さを \(400\) 回測定したところ、平均値 \(10.4\,{\rm cm}\)、標準偏差 \(0.2\,{\rm cm}\) であった。この正方形の面積を信頼度 \(95\)%で推定せよ。
さいころを投げて、\(1\) の目が出る確率を信頼度 \(95\)%で推定する。
(1)\(500\) 回投げたとき、\(1\) の目が出る確率の信頼区間を求めよ。(小数第\(4\)位を四捨五入せよ。)
(2)信頼区間の幅が \(0.07\) 以下になるには、さいころを少なくとも何回以上投げればよいか。
仮説検定の考え方
ある \(1\) 個のコインを \(400\) 回投げたところ、表が \(178\) 回出た。このコインの表が出る確率は \(\displaystyle \frac{1}{2}\) ではないと判断してよいか。有意水準 \(5\)%で検定せよ。
発芽率が \(60\)%の種子に対して、発芽率が向上するように品種改良を行なった。改良後の種子から無作為に \(600\) 個抽出して種を蒔いたところ、\(384\) 個が発芽した。品種改良によって発芽率は向上したと判断してよいか。次の有意水準で検定せよ。
(1)有意水準 \(5\)%
(2)有意水準 \(1\)%
ある数学の試験を全国の高校を対象に行ったところ、全国の平均点は \(54.2\) 点であった。ある \({\rm M}\) 高校の生徒から \(100\) 人を抽出したところ、その平均点は \(52.0\) 点で、標準偏差は \(12.0\) であった。このとき、\({\rm M}\) 高校全体の平均点は、全国の平均点と異なると判断してよいか。有意水準 \(5\)%で検定せよ。
コメント