ちなみに昨日Rの勉強会だったので、このブログをN先生に見せたのだが、なんと身長はtallではなく、heightが正しいらしい。
めちゃくちゃ恥ずかしいが、今更治すのも面倒なのでこのまま押し切る事にしよう。
僕のししょー(生理、実験系)は、
「データをGetしたらまず散布図を作りなさい。そしてその散布図を眺めなさい」
と僕に教えてくれた。
ということでまずは散布図を作成する。
一番簡単そうなtall(正しくはheightね)とweightでチャレンジ。
plot(tall,weight)
これで散布図は出てくるはず。
あれ?オブジェクトがありませんときたもんだ。
「!!」
そうだattach(s)がない。
このattach(s)は、コマンドの最初に入れた時に以降のコマンドは全部sのデータを利用するというような意味で、エディタで一気にコマンドを入れてしまうような場合に便利(と理解している)。
今回は、コンソールでいろいろやるのでいちいちコマンドにsのデータを使うというメッセージを入れてみる。
s$と入れるのが正しいらしい。
plot(s$tall,s$weight)
これでsのデータの中から、tallとweight の散布図を作れ というコマンドになる。
よし。できた!!美しい散布図だ。このファイルは、形成できるのかな??論文で使えるのかしら?保存は?まあまだまだわかんないことばかりだが、放置して次に行こう。
しかし、いちいちこれをすべての組み合わせでやるのが面倒くさいよね。
ということで総当たりの散布図
plot(s)
ししょー!!
たしかにわかりやすいですたい!!散布図万歳!!
ほほう。やはり身長と体重の散布図を見ると相関はありそうですね。ということで関数corを使ってみる。$を忘れないように。
cor(s$tall,s$weight)
さらに総当たり戦もやってみる。
cor(s)
よし。なんかいい感じ。
noはIDにしとけばよかったかな。
相関表を見てみるといろいろ気になる事が出てきた。
1.性別は、男性0,女性1にしてるけどこれはカテゴリカルデータだよね。数字データのままで大丈夫?
2.custom(習慣),Inhe(遺伝) は5段階の順序尺度だけどこれもこのままでいいのか?
3.相関の有意は出ないのかな?
しばらくは検討を重ねる。