ちょっといまいちわかってないのでもう一度最初からやってみる。
まずは、等分散性の検定について検討(F検定と呼ばれるもの)。
僕が習った方法としては、t検定では(分散分析でも)まず実際の分析にかける前に、このF検定を行って調べたい両者が同じ分散を持っているか、否かを判断する必要があるという。
もちろん、Rにもその関数はあった。
var.test というものだ。
今回のデータでは、体重のばらつきが、男性でも女性でも一緒なのか?という意味になる。バラつきが一緒な場合と、ばらつきが違う場合では検定の方法が違いますよということらしい。
(これは青木先生のページを見ると、必ずしもやらなくても最初から等分散を規定しない方法でやればいいとのことだが、難しいことはよくわからないので一応原則通りやってみる)
早速やってみよう。
ふむ。なんか出てきた。だいぶ分かってきた感じもするなあ。
これの見方は、えっとp-value = 0.03822 だから。。。
これは当分散性が棄却されたということに違いない(間違っていたら誰か教えてくれ)。
ということで、この場合には体重のばらつきは男性と女性で同じではないので、そのための分析をしなさいね。ということになるのだ。
Rではデフォルトでウェルチなので(等分散を規定しない)
t.test(s$weight~s$sex) となりました。
これは、 p-value = 0.001493 なので有意。男女間で体重には有意な隔たりがあるということだな。
※こういったデータの場合は普通は当分散になるはずだけど(実際に僕の少ない経験ではここが棄却されることはほとんどない。もし、棄却されたらなんか間違ってるかと思って見直す感じ)たぶん、この練習データはあまりにも人数が少ないので棄却されたんだろうと思う。
ということで、もし等分散性が棄却されなかったらどうするか?
その場合には、var.equal=TRUE を追加すればいい。
確かにあんまり数字としては変わらないね。。。
状況に応じて使い分けるという感じかな。。
だれかわかり安く教えてくれる人がいればお願いします。