気合でなんとか

@ningensei848が頑張った記録

2017秋学期 木曜 量的調査法 5週目

前回までのあらすじ

ningensei848.hatenablog.com

 

 

標本の抽出(教科書 5 章)
調査の母集団の決定(p.72 図 5.1)
仮説の真偽を確かめるための調査は誰を対象に行うべきか
母集団-調査テーマに関係する集団全員の集合
前提として明らかにすべきこと-属性,範囲,適用される時間
標本調査の意義


全数調査(悉皆調査)

調査の母集団全員を対象とする調査.例:国勢調査 670 億円(2015 年度単年度で)
極めて基礎的な統計,業務統計(本来は審査や会計事務など別の業務のために集められたデータ)など。または母集団が小規模な場合(標本調査では十分な精度が得られない)欠点:調査が大規模となり費用がかかる(調査費用,分析費用など)

 


標本調査

調査の母集団中の適当な部分集合(標本-sample)を対象に調査する方法
全体の中からその代表として一部を選んで調査することで,全体の傾向を推定する。
欠点:全体と完全に一致することはない
調査誤差の考え方
調査誤差=標本誤差+非標本誤差
標本誤差:標本と母集団のずれ。無作為抽出においては統計的に管理できる。一般に標本数に関わらず一定割合
非標本誤差:母集団と抽出枠のずれ,調査票の不適切な設計や調査員の誤った指示・態度に由来する誤差,被調査者の誤記や虚偽,メイキング(不正回答),集計段階でのコーディング・転記・集計などのミス。標本数に比例して増大する。

 


標本調査の意義

1) 全体としての精度を全数調査より高めることができる
2) 少数で良質な調査員を使うことができる
3) 調査全体の管理が容易・費用も安価
4) 調査による社会的な影響を小さく留めることができる

 


標本調査の種類

標本抽出の妥当性とは:母集団からの代表性,調査誤差の評価可能性
標本抽出の方法:無作為抽出と有意抽出


有意抽出
母集団をよりよく代表すると思われる標本を調査者が意図的に(恣意的に)選び出す方法


典型抽出法(judgmental sampling)
母集団の典型を示すような範囲(集団や地域)を意図的に標本とする方法。

通常は中間的(平均的)な性格の集団(例えば中位所得層や中位年齢層)を選ぶ。
→何が中間的かの判断が必要(判断の正当性が保証されない)


割り当て抽出法(quota sampling)
調査項目と関係が深いと思われる基本属性(性,年齢,居住地域など)ごとに母集団をわけ,その集団ごとに集団の大きさに応じた標本数を割り当てた上で,恣意的に標本を抽出する方法
割り当てなしの完全に恣意的な標本抽出よりも,外形的な母集団への近似性は高まる。
→割り当てに用いる属性の判断が必要

 

雪だるま式調査(snowball sampling)
少数の調査から開始し,被調査者を情報提供者として,次の被調査者を収集する方法。
社会的に隠れた母集団を対象とした調査などで使用する
→代表性は全く保証されない

 


無作為抽出(確率的抽出,ランダムサンプリング)

母集団を構成する全ての要素(個人あるいは世帯など)が等しく選ばれる可能性を持つように標本抽出をおこなう方法.母集団に対してどの程度の規模の標本を抽出すれば,どの程度の精度が達成されるかが評価できる。


抽出台帳 (sampling frame)
住民基本台帳,選挙人名簿,国勢調査や事業所調査の調査台帳,電話帳,職員名簿など
・完全性(もれがない,重複がない)
・更新性(対象集団の異動に伴い,リストが更新されること)

 

単純無作為抽出 p.76
抽出台帳から乱数表などで決められた標本数の標本を抜き出す方法.抽出台帳以外の予備知識の必要がない。
○母数の推定が簡単
×大標本の場合,台帳の調達が困難.抽出作業が煩雑.調査が困難

 

系統抽出法 p.77
単純無作為抽出の抽出作業の煩雑さを除くために,最初の標本を乱数で選んだ後は,一定間隔で以後の標本を抽出する方法。間隔は任意で良いが,通常は母集団の数を必要標本数で割った値(切り捨てで整数化)を用いる.または近辺の素数
×台帳が規則的な場合に偏りが生じる可能性。
→標本数が大きい(n>50)とき,経験的に単純無作為抽出と同じ方法で標準誤差を計算して良いとされている。

 

多段抽出法 p.79
地理的単位(社会的な集団の単位)であらかじめ無作為な抽出をおこない(正確にはその単位の大きさに比例抽出),その地理的な単位の中で単純無作為抽出によって標本を抽出する方法

○抽出台帳の調達,標本抽出の費用,標本の地理的拡散による調査費用の面が大きな負担となるが,軽減する効果がある。
×標本誤差は増える。
→層別抽出法と組み合わせる(一段目の抽出において)ことが多い-層化多段抽出法
→経験的には単純無作為抽出に比べて,2 段で 1.5 から 2 倍,3 段で 2 から 3 倍程度の標本数を確保すれば精度を保てるとされている

 

層別(層化)抽出法 p.81
標本抽出には一定の標本誤差が必ずあるが,調査テーマに関係する重要な属性は,偏った標本とならないようにあらかじめ母集団を層別に分け,その層ごとに抽出すべき標本数を割り当てることで,標本誤差を減少させる方法。
→割り当て法との違いは,層内の抽出が無作為か恣意的かの違いにある

 

 


層別の標本数の割り当て方
比例割当
母集団の各層の大きさに比例するように標本数を配分
→事後の統計処理が簡単.場合によっては加重抽出(ある層だけ多くまたは少なく抽出
する)ことが必要
最適割当(ノイマン割り当て)
各層の大きさとその分散の積に比例するように標本数を配分


[実際の方法]
1. 地点あたりの標本数を決める-10~20 票程度(少ないと精度があがって,効率がさがる),標本数から調査地点数が決まる
2. 町丁字別人口を調べて人口に比例して町丁字を抽出する
3. 市町村役場で住民基本台帳から調査対象者を転記する(ここでは系統抽出する)


集落抽出法
地理的な単位(社会的な集団の単位)を無作為抽出し,それに対して全数調査をおこなう方法
無作為抽出における母集団と標本(p.82)
目標母集団,調査母集団,計画標本,有効標本 標本から母集団の特性値を推定する
標本分布(サンプリング分布 6 章 p.85)
中心極限定理⇒単純無作為抽出で得られた調査結果から推定される平均値(=標本平均
x)は,期待値が母数と一致し,分散は σ2/n の正規分布である.
・母集団の大きさと標本の大きさが共に大きい N>100, n>30 程度
・標本の大きさに比べて母集団の大きさが十分大きい N≫n


標本数の決定(教科書になし)
調査結果として得られる推定値が目的に充分な精度となるように標本数を決めればよい

 

 

次回

 

ningensei848.hatenablog.com