« 音楽を「聞かせる」 | トップページ | 検定について補足 »

2009年3月17日 (火)

ノート:心理学研究法(11)

○第9章 サンプリングと統計的推測(南風原朝和)

§1 母集団とサンプル

▼目標母集団

量的調査によって仮説の検討を行う場合、その仮説が「どのような集団」において成り立つのかを考える。年齢や職業によらず一般的に成り立つのか、ある範囲の年齢や職業群において成り立つのか。←つまり、「研究結果をそこに一般化したい集団」:目標母集団(target population)

▼達成母集団

実際の研究は、目標母集団に属する全ての人を対象には出来ない→一部をサンプル標本)として選び研究する。

第6章での例、「ある大きな大学の新入生からランダムに選んだ100人の被験者」。←目標母集団を「日本の青年」とすると、このサンプルは、目標母集団から直接選ばれた事にはならない。目標母集団の部分集合たる「ある大きな大学の新入生」から選ばれたサンプル。実際にサンプルを選ぶ際に対象となる集団を、達成母集団(achieved population)という。

▼一般化の問題

目標母集団と達成母集団が異なる場合←サンプルで得られた結果をどこまで一般化出来るか、という問題がある。

  • 目標母集団:「60歳以上の女性」
  • サンプル:高齢者のためのスポーツ大会への参加者(短期間に大勢のデータが集められるから、などの理由)
  • →達成母集団:「60歳以上の女性の内、スポーツ大会への潜在的な参加者集団」
  • その母集団(ここでの達成母集団)は、目標母集団に較べて、身体的にも精神的にも健康度が高い事が予想される。
  • 従って、この標本調査で得られた結果を目標母集団に一般化する事には問題がある。

これらを考えて、過度の一般化を避けるよう心がける必要がある。

§2 サンプリングと統計的推測

▼サンプリングに伴う結果の変動

ある母集団からサンプルを選ぶ→実際にどういう人が選ばれるかによって、サンプルにおける結果は変化する。

本書では、100人の母集団から大きさ8のサンプルを採り出して相関係数を計算する、という例が出されている。そこでは、採られたサンプルによって、0.3程度も相関係数が異なる事があるのが示されている。つまり、100個の要素の中からランダム(無作為)に8個の要素(大きさ8のサンプル)を採り出して相関係数を計算するのを繰り返すとすると、その都度採り出されるサンプルは異なる訳だから、そこから算出される相関係数の値も異なる、というのを意味する。

大きさ100の母集団から大きさ8のサンプルを抽出して相関係数を計算するのを1万回繰り返して(つまり、標本の”数”が1万)ヒストグラムを描いた図が載っている。そこでは、かなり広く分布しており、母集団における相関係数から大きく離れた値もある程度の割合がある。これは、サンプルが小さいから誤差も大きくなるというのを意味する。

▼統計量の標本分布

平均や相関係数等の統計的指標に関して、「母集団における値」を母数(parameter)と呼ぶ。

対して、サンプルに依存して変動する値を統計量標本統計量)と呼ぶ。母数は、全数調査を行う場合等以外、通常は未知である。

サンプリングに伴う統計量の値の変動を示す分布を、その統計量の標本分布と呼ぶ。つまり、母集団から大きさ n のサンプルを抽出して算出される統計量の分布、という事。先の例で言うと、大きさ100の母集団から大きさ8の標本を抽出して計算した相関係数をヒストグラムに描いたものが、標本分布となる。母集団に色々の仮定をおけば、標本分布は数学的・理論的に導ける。

▼サンプリングのランダム性

統計量の標本分布を数学的に導く場合、「サンプルが母集団からランダム(無作為)」に選ばれる事が前提となる。

ランダムサンプリング:その母集団に含まれるどのメンバーが選ばれる可能性も等しく、さらに、一組のサンプルとしてどのようなメンバーの組が選ばれる可能性も等しくなるようなサンプリング。

母集団が、メンバーを特定出来るようなものであれば、ランダムサンプリングはそれほど難しく無い。しかし、母集団が非常に大きい場合等は、容易では無い。

現実の心理学研究――知り合いの複数の教師に依頼して、その人達が担任する学級の子ども達を被験者にする、というようなやり方がしばしば見られる→サンプリングはランダムとは言えず、そもそも母集団が何であるかすらはっきりしない。

次節以降で述べる統計的推測――ランダムサンプリングを前提として導かれた標本分布を基礎としたもの。従って、母集団からのランダムサンプリングがなされていない場合には、その方法は厳密には適用出来ない。しかし、現実の心理学研究では、ランダムサンプリングがなされていない場合も、統計的推測の方法が適用されている。

筆者(南風原氏)の考え:「実際のサンプルに合わせて母集団を限定する」作業が必要←サンプルの結果の無制限な一般化を防ぐ。

しかし、実際のサンプルがランダムサンプルで無いという事実は変わらない。これについては、

  • ランダムサンプルと看做して統計的推測の方法を利用する立場
  • それらの方法を全く利用しない立場

が考えられる。本書では前者の立場。

§3 相関係数に関する検定

▼統計的検定

心理学の研究では、サンプルで得られた相関係数等の統計量の値を解釈する時に、統計的検定を利用する事が多い。

例:相関係数に関する検定→「サンプルで得られた相関係数の値は、母集団における相関がゼロであるということと矛盾するほどに大きな値であるかどうか」という判断(無相関検定)。

つまり、研究では母集団の性質を知りたいが、実際には標本しか得られないので、標本で得られた値から母集団の性質を「推測」する必要があるという事。その場合に、母集団がこうであれば、標本ではこういう値が出るであろう、というのが数学的に導かれる(標本分布)のを利用する。つまり、それを逆に使い、「標本でこういう値が出たという事は、母集団はこうなっているだろう」と「推測」するという意味。今の例では、母集団において相関関係があるかを知りたい訳だから、「母集団において相関がゼロである」という仮説を立てて、それを調べるという事になる。

▼帰無仮説と棄却域

仮説:母集団における相関係数はゼロである。

この仮説が成り立っているとしたら、その母集団から抽出してきた標本から得られた統計量はどういう値をとるか、というのが数学的に導ける。そして、どうも、母集団の相関係数がゼロであるとすると、この標本統計量(本書では標本相関係数)が出る確率的は小さいようだ、だから、そもそも仮説:「母集団における相関係数はゼロである」という仮説が間違っているのだろう、と判断する。そうすれば、そもそも確かめたい仮説である所の、母集団において相関関係がある、というのを支持する事が出来る。ここで、最初に立てた仮説を、帰無仮説(null hypothesis)と呼び、帰無仮説が正しいとした場合(帰無仮説のもとで)の標本統計量の分布(ここでは標本相関係数の分布)を帰無分布と言う。

つまり、実際に得た標本から計算した統計量よりも極端な値が出現する確率が小さい場合、それは母集団に関する最初の仮説(帰無仮説)が間違っているからだと判断する、という事。そして、その「小さい確率」の基準を有意水準と言い、そこに入れば棄却するという領域を、棄却域と呼ぶ。棄却域に入った場合、帰無仮説を棄却(reject)する。その事を有意である、と言う。

▼有意となる相関係数の値とサンプルサイズ

サンプルサイズが小さい場合――サンプルから得られる相関係数の値は安定せず、母集団における値(これは、母集団における定数、つまり母数)から離れる可能性も大きい。

サンプルサイズが大きい場合――サンプルから得られる相関係数の値は安定し、標本分布の広がりも小さくなる。

母集団相関係数がゼロ、という場合の標本分布(帰無分布)の広がりは、サンプルサイズが大きくなるほど、ゼロの周りに集中し(つまり、標本を抽出して相関係数を計算すれば、ゼロに近い値をとる確率が大きい)、広がりも小さくなる。

つまり、サンプルが小さい場合は、標本での相関係数がかなり大きくならないと有意にはならないし、サンプルサイズが大きいと、それほど標本での相関係数が大きく無くとも、有意になる、という事。

------------

以下、推定、信頼区間の計算、信頼区間の大きさを一定にして例数設計をする、という説明がありますが、簡潔過ぎて、まとめても訳が解らないと思うので、省略します。多分、上の検定の説明も、不案内な人は混乱必至でしょう。

不明な所があれば、コメントを頂ければ。可能な限り説明しますし、私の手に負えない部分は、手助けして下さる方がいらっしゃるかも…。統計の具体的方法について知らなくても、「有意」等の概念に関しては関心がある、という場合もあると思いますので。

|

« 音楽を「聞かせる」 | トップページ | 検定について補足 »

科学論」カテゴリの記事

ノート:心理学研究法」カテゴリの記事

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: ノート:心理学研究法(11):

« 音楽を「聞かせる」 | トップページ | 検定について補足 »