気合でなんとか

@ningensei848が頑張った記録

2017秋学期 木曜 量的調査法 7週目

 

前回までのあらすじ

ningensei848.hatenablog.com

復習:離散尺度の単純集計:度数分布表と棒グラフ・円グラフ

離散尺度ではそれぞれの尺度がどのような頻度で起きたかを表にまとめる.これを度数分布表という.
また,度数を直観的に比較するために棒グラフ,相対度数を表現するためには円グラフを使用する.
科学の世界におけるグラフは数値を直観的に理解するための道具であり,数値を正確に表現することが本質であることに注意する必要がある.

連続尺度の単純集計:ヒストグラムと二種類の特性値

Excel ではちゃんとしたヒストグラムは描けない(手間がかかる).
Excel で特性値を計算させるには,「ツール」メニューから「アドイン」を実行し,「分析ツール」にチェックを入れる.

  • 中央値(メディアン):
    これまた同じ考え方で,大きさの順に並べた際に二等分する値.つまり 50 パーセンタイル.
    便宜的に 4 個のデータがある時には 2 番目と 3 番目の値の平均,5 個のデータがあるときには 3 番目の値を指す.
  • 最大値・最小値:説明省略
  • モーメント:
    変数値のべき乗(r 乗)の期待値を(r 次の)moment(=積率)という.
    ある値との差の r 乗の期待値を r 次の central moment(=偏差積率)という.
    (力学からの類推)→計算が簡単,正規分布の特性値と一致(うれしい),外れ値の影響大(悲しい)
  • (標本)平均:(原点(=0)まわりの)1 次の積率
  • (標本)分散:標本平均まわりの 2 次の偏差積率
  • 標準偏差:分散の正の平方根→単位が一致(うれしい)標準誤差:統計量自体の標準偏差.通常は標本平均の標準偏差
  • 95%信頼区間
    母平均が95%の確率でその範囲にあるということを表す。
    例えば、「母集団から標本を取ってきて、その平均から95%信頼区間を求める」、という作業を100回やったときに、95回はその区間の中に母平均が含まれることになる。

汎用統計分析ソフトウェア:SPSS

2010 年に IBM に買収され,IBM SPSS という名前になった、統計処理と多変量解析を行うためのソフトウェア。 SAS と並んで大型計算機時代からの長い歴史を持っている.
日本の汎用統計ソフトウェア市場では,一般向けでは SPSS,研究者向けでは R(フリーソフト)がそれぞれ多くの利用者を獲得している.

クロス集計と分割表による分析

分割表を読むと,二つの変数間でどのように構成比が違うかを確認することができる.
重要なこと:<二つの変数の関係の有無を分析するのであって,普通の意味での因果関係を検証するものではない.
一般に二種類の変数間の関係を分析する上で,以下の組み合わせが考えられる.

  • 分割表の分析:
    2 種類の離散変数の反応に特定の傾向が見られるかを分析する.→特定の傾向が無い可能 性(確率)を計量する.これを独立性の検定という.
  • 一元配置分散分析
    離散変数のカテゴリ(例えば男・女)ごとの連続変数の平均値に違いがあるかを分析する.
  • 相関分析
    連続変数同士の関係(例えば A が大きいと B は大きい,A が小さいと B も小さい)の強さを計量する.これを相関係数という