散布図と相関

ちなみに昨日Rの勉強会だったので、このブログをN先生に見せたのだが、なんと身長はtallではなく、heightが正しいらしい。

めちゃくちゃ恥ずかしいが、今更治すのも面倒なのでこのまま押し切る事にしよう。

僕のししょー(生理、実験系)は、
「データをGetしたらまず散布図を作りなさい。そしてその散布図を眺めなさい」

と僕に教えてくれた。

ということでまずは散布図を作成する。
一番簡単そうなtall(正しくはheightね)とweightでチャレンジ。

plot(tall,weight)
これで散布図は出てくるはず。

f:id:jigawa91:20110507122036j:image

あれ?オブジェクトがありませんときたもんだ。

「!!」

そうだattach(s)がない。
このattach(s)は、コマンドの最初に入れた時に以降のコマンドは全部sのデータを利用するというような意味で、エディタで一気にコマンドを入れてしまうような場合に便利(と理解している)。

今回は、コンソールでいろいろやるのでいちいちコマンドにsのデータを使うというメッセージを入れてみる。

s$と入れるのが正しいらしい。
plot(s$tall,s$weight)

これでsのデータの中から、tallとweight の散布図を作れ というコマンドになる。

f:id:jigawa91:20110507122037j:image

よし。できた!!美しい散布図だ。このファイルは、形成できるのかな??論文で使えるのかしら?保存は?まあまだまだわかんないことばかりだが、放置して次に行こう。

しかし、いちいちこれをすべての組み合わせでやるのが面倒くさいよね。

ということで総当たりの散布図

plot(s)

f:id:jigawa91:20110507122038j:image

ししょー!!
たしかにわかりやすいですたい!!散布図万歳!!

ほほう。やはり身長と体重の散布図を見ると相関はありそうですね。ということで関数corを使ってみる。$を忘れないように。

cor(s$tall,s$weight)

さらに総当たり戦もやってみる。

cor(s)

f:id:jigawa91:20110507124055j:image

よし。なんかいい感じ。
noはIDにしとけばよかったかな。

相関表を見てみるといろいろ気になる事が出てきた。

1.性別は、男性0,女性1にしてるけどこれはカテゴリカルデータだよね。数字データのままで大丈夫?
2.custom(習慣),Inhe(遺伝) は5段階の順序尺度だけどこれもこのままでいいのか?
3.相関の有意は出ないのかな?

しばらくは検討を重ねる。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です