« ノート:心理学研究法(11) | トップページ | decryption »

2009年3月17日 (火)

検定について補足

直前のエントリー(Interdisciplinary: ノート:心理学研究法(11) )の補足。統計的仮説検定の説明を。

まず、調べたい仮説を設定します。ここでは、「惑星ベジータにいるサイヤ人の尻尾の長さと戦闘力には相関関係がある」、とでもしましょうか。つまり、尻尾が長いほど戦闘力が高いか、尻尾が短いほど戦闘力が高い、というどちらかの関係があるというのを確かめたい。

この場合の目標母集団は、ある時点において惑星ベジータにいるサイヤ人、ですね。本当は、サイヤ人一般はそうなのか、というのを調べたいものだと思いますが、取り敢えずは、有限の集合として、このように設定しましょう。

さて、ここからサンプルを抽出する訳ですが、ここで、採り方が問題になります。ベジータ直属のエリート集団から採り出してきたとしても、惑星ベジータに住む人一般、という調べたい母集団の性質に一般化は出来ないという事です。

だから、本来、惑星ベジータに住む全員に番号を振って、そこから無作為に採り出してくる必要があります。実際は、そんな名簿がある社会があるのだろうか、とか、そういう問題が出てくる訳ですが、それを考えると話が複雑になって、標本調査論という専門的な領域の問題になるので、ここでは、全て一元管理されていて、台帳が存在するとしておきます。

さて、段取りは整いました。ここからは、実際に標本を抽出して相関係数を計算する、という流れです。

惑星ベジータの人口がどのくらいかは知りませんが、数万はいる事でしょう。そこから何人かを抽出して、相関係数を計算する訳ですね。

ここで、標本の抽出のされ方、を考えます。大きさ3の標本を採る、としましょうか。今は、母集団から大きさ3の標本をランダムに抽出するのですから、誰が選ばれるかは様々、となります。ベジータとナッパとブロリーが抽出される事もあれば、カカロットとラディッツとターレスが抽出される事もある(←突込んだら負け)。で、そのあり得る組み合わせでの相関係数を全て計算してグラフにすれば、標本相関係数の分布が描けます。これが、「標本分布(または標本抽出分布):sampling distribution」です。

これを踏まえて、検定の話です。

確かめたい仮説は、(以下、一部省略して書く)「尻尾の長さと戦闘力に相関関係がある」、でしたね。で、検定においては、それを調べるために、その仮説を否定する仮説を立てます。つまり、「尻尾の長さと戦闘力に相関関係が無い」という仮説。これを具体的に数学的に書くと、「尻尾の長さと戦闘力の母集団における相関係数(母相関係数)はゼロである」、となります。これを否定出来れば、元々確かめたい仮説が支持される、という寸法であります。そして、その否定したい仮説を、「帰無仮説」と呼ぶ訳です。

そして、その帰無仮説が正しいとした場合の母集団からサンプルを採り出して相関係数を計算して、その相関係数の分布を求める事が出来ます。母集団での相関係数がゼロであった場合の、標本相関係数の分布。標本統計量の分布を「標本分布」というのでしたね。で、帰無仮説が正しいとした場合の標本統計量の分布を特に、「帰無分布」と言います。要するに、帰無仮説が正しければ標本ではどういう値が出るか、という事。それは数学的に導けます。

で、実際に標本を抽出します。3とかではあまりにも小さいので、何十かにしましょう。当然、こういう検定の場合、普通は標本は一度採ります。つまり、何十人かを台帳からランダムに選んで、実際に尻尾の長さを測り、スカウターで戦闘力を測定する訳です。

そうすると、標本における相関係数が計算出来ますね。この相関係数は、標本統計量です。検定の場合は特に、「検定統計量」と呼びます。

先にも言った通り、全部を調べる事は出来ないので、一部を調べるしか無い訳です。ナッパやベジータが選ばれる場合もあれば、カカロットやブロリーが選ばれる場合もある。何通りもある訳ですね。だから、実際に得られた(実現値)相関係数は、何通りも選ばれる可能性のある相関係数の一つ、という事です。

上で、帰無仮説を立てました。そして、帰無仮説が正しい場合の、「標本相関係数の分布(帰無分布)」も数学的に導ける、と言いました。という事は、実際に得た標本から計算した相関係数が、その帰無分布のどこら辺に落ちるか、というのも解るのですね。

つまり、帰無仮説が正しいとしたら、実際に得た相関係数より極端な値が出る確率はこのくらいだ、というのを調べる事が出来る。母集団の相関係数がゼロの場合にこの標本が出るのはおかしい/おかしく無い と判断する訳です。

そして、その判断の基準を、「有意水準(危険率)」と呼ぶのです。それはあらかじめ決めておきます。で、実際に得られた統計量より極端な値をとる確率が有意水準より小さい場合、「帰無仮説が間違っているのだろう」と判断するのです(帰無仮説を棄却する)。これが、「有意」であるという事です。

|

« ノート:心理学研究法(11) | トップページ | decryption »

「科学論」カテゴリの記事

コメント

実際は、有限母集団/無限母集団 復元抽出/非復元抽出 等の問題が絡んできて複雑になるけれども、多少単純化しました。

ちなみに、帰無仮説に対応する仮説を、「対立仮説」と言います。ここの例の場合、「母集団における尻尾の長さと戦闘力との相関係数がゼロで無い」、という仮説。

投稿: TAKESAN | 2009年3月17日 (火) 02:01

大分前に、研究対象集団の設定(標本の抽出)の場合に想定する母集団と、統計的検定(の説明)に使われる母集団とは別な物であると習ったという話を出したことがあったと思います。そういう背景からの質問ですが、南風原氏は統計的検定が標本の観察結果を(前回の解説で使われたことばですと)達成母集団に一般化するための方法である、と考えていると思ってもいいでしょうか。TAKESANさんの読まれた(あるいはお持ちの)他の本(たとえば大村平氏とかの)で、そのへんをはっきり説明してくれているものはありますか?

投稿: ちがやまる | 2009年3月19日 (木) 14:19

ちがやまるさん、今日は。

▼▼▼引用▼▼▼
統計的検定が標本の観察結果を(前回の解説で使われたことばですと)達成母集団に一般化するための方法である、
▲▲引用終了▲▲
すみません、ここの所が、ちょっと掴めないです。で、掴めないままに書くので、ちょっと的外れになるかも知れません。

検定の結果は達成母集団にまでしか一般化出来ない、という事かと思います。

後、
▼▼▼引用▼▼▼
研究対象集団の設定(標本の抽出)の場合に想定する母集団と、統計的検定(の説明)に使われる母集団とは別な物である
▲▲引用終了▲▲
ここもちょっと読み取れなかった、と言うか、その2つの母集団の違いというのがイメージ出来なかったので、具体的に説明して頂けるとありがたいです。

投稿: TAKESAN | 2009年3月19日 (木) 14:34

以前に私が書かせていただいたものの発掘が難しそうだったので、今回のTAKESANさんのエントリにもとづく質問として提出しなおします。
「これを踏まえて、検定の話です。」とあるところの次の次のパラグラフで、
「母集団からサンプルを採り出して相関係数を計算して、」とありますが、この「母集団」ということばはどの集団を示しているのでしょうか。
さあ検定をするよ、と言ってから抽出操作が入るのは(複雑な抽出法を使うような場合にシミュレーションによってばらつきを推定するような場合を除けば)よくわかりません。

それはひとつ前のエントリ「ノート:心理学研究法(11)」の「▼統計的検定」に書かれたこととも関連するかと思いますが、
「つまり、研究では母集団の性質を知りたいが、実際には標本しか得られないので、標本で得られた値から母集団の性質を「推測」する必要があるという事。」
これは南風原氏の説明内容であるとすると、「母集団」はたとえば惑星ベジータの例ではどれに相当するのでしょうか。

投稿: ちがやまる | 2009年3月19日 (木) 15:22

▼▼▼引用▼▼▼
この「母集団」ということばはどの集団を示しているのでしょうか。
▲▲引用終了▲▲
ここでは、「惑星ベジータにいるサイヤ人」となるかと思います。実際は、台帳に記載されているサイヤ人の集合、でしょうか。

▼▼▼引用▼▼▼
さあ検定をするよ、と言ってから抽出操作が入るのは
▲▲引用終了▲▲
えっと、ここは、私がそう書いた、という事ですよね? でも多分、私はそういうのは書いていないです。
もしかしたら誤解があるかも知れませんが、「これを踏まえて」という文章の「これ」は、ランダムサンプリングと標本(抽出)分布の説明、にかかっています。標本が母集団からランダムに採られている必要があるのと、統計量が分布する、というのを説明して、それから検定の説明をしよう、としました。「これを踏まえて」の前後で連続したプロセスを記述している訳では無い、となるでしょうか。

投稿: TAKESAN | 2009年3月19日 (木) 16:24

1. 母集団→標本における観察→母集団に関する推定
2. 統計的検定

2.は標本における観察の一環なので、このふたつは全く別個のものとして扱う方がいいだろう、と私はいいたかったわけです。書いておられるTAKESANさんもそのつもりであり、南風原氏もそのように扱っている、ということであれば言うことはありません。

たぶん私は近々若い人相手に統計的検定の説明をすることになると思いますが、検定の考え方の説明はフィッシャー流でいこうと考えています。第一種、第二種の過誤については全くふれないわけにいきませんので、検定の中味とは切り離してあくまでも判断の過誤の分類として紹介するつもりでいます。

投稿: ちがやまる | 2009年3月19日 (木) 17:20

うーむ、私としては、一般的なテキストに書かれてあるような事を記述したつもりであったので、やはり、どういう所を指摘されているのか、ちょっと掴めないのでした。
もう少し考えてみます。

投稿: TAKESAN | 2009年3月19日 (木) 18:01

あ、それと。

私は南風原氏の書いたものをよく参考にしていますが、かと言って、自分がきちんと読み取れている、解釈出来ているとは限らないので、そこはよろしくお願いします。出来れば南風原氏の著作を参照して頂ければ。

投稿: TAKESAN | 2009年3月19日 (木) 18:07

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/13103/28654435

この記事へのトラックバック一覧です: 検定について補足:

« ノート:心理学研究法(11) | トップページ | decryption »