(第2回)サンプルは母集団を代表しているか? —「無回答による偏り」を中心に
現実を「統計的に理解する」ための初歩の初歩(麻生一枝)| 2019.12.18

(毎月中旬更新予定)
私たちは、何らかの集団について、何かを知りたくてデータをとる。数学の期末試験のクラス平均は何点だろう。4 月に入学してきた新入生は、一年後、大学の授業にどの程度満足しているのだろうか。横浜市民は IR 誘致についてどう思っているのだろう。どれくらいの日本人が憲法改正に賛成、または、反対なのだろうか。食後に飲むと血糖値が下がると謳われている健康飲料は、実際に血糖値を下げる効果があるのだろうか。
クラスの平均点や新入生の満足度など、集団のサイズが小さい場合は、原則的には、集団のメンバー全員からデータをとることができる。しかし、横浜市民や日本人全体のように集団のサイズが大きくなると、全員からデータをとるのはむずかしい。そこで、興味の対象である集団(母集団)から一部(サンプル)をとって調べ、その結果にもとづいて、元の集団についての結論を導くことになる。
この「母集団からサンプルをとる」という作業をサンプリングというが、サンプリングで重要なのが、とったサンプルが母集団を代表していること、つまり、サンプルに偏りがないことだ。
