カテゴリーデータを定義付け

カテゴリーデータの扱いについてべんきょーしてみる。

ということで、今使っているデータはカテゴリーデータが性別しかないので、ちょっと追加してみた。

race は人種で。0-white,1-black,2-yellowということにしてみよう。保存してみた。

Rを起動してsを読み込んでみる。

あら、そのままデータは反映されないのね。
本当ならsの次のファイルで読み込んじゃえばいいと思うのだけど。
ちょっといろいろ作りすぎてわけわからんくなってるので一度がっつり消しちゃいましょう。

編集のコンソールの消去とワークスペースの消去をしていったん奇麗にします。

これでsを入れてもでてこない。

ということで最初から読み込み直し。

s<-read.csv(“yome.csv,header=t,sep=’,’)
s
よし、だいぶ覚えてきたなあ。

さて、このデータのうち、sexとrace は性別(男、女)と人種(白人、黒人、黄色人種)だから，コイツをうまい事しないと。

ふむふむ。カテゴリーデータの定義付けというヤツが必要。

この定義付けがうまくいけば、分散分析やフループごとの散布図などが出来るらしい。

試行錯誤の結果作ったコマンドがこれ。
性別について定義付けを行う。
> s$sex<-factor(s$sex,levels=0,labels=”male”)
sのデータの変数のsex の0というのは、maleですよ。

というようなコマンド。これでsを見てみる。

よし、男性はmaleになった。続いて女子もやってみる。
といいたいところだけど、めんどうなので一気にやりたいよね。

っとかなり試行錯誤した結果がこちら

s$sex<-factor(s$sex,levels=0:1,labels=c(“male”,”female”))

ミソは、0:1 の所。これは0と1ではなく、0から1という感じで捉えるべきみたい。

続いてrace(人種)
s$race<-factor(s$race,levels=0:2,labels=c(“white”,”black”,”yellow”))

sのデータのraceという変数に右辺の式を代入しますよ。
sのデータのraceという変数は、0～2まであって、そのラベルは
white black yellow ですよ。という感じかな。

よーしいってみよう!

きたーーーーー!!!
ちなみに一口に試行錯誤とは書いてありますが、だいたい2時間くらいはかかってますけどね。

今日のまとめのRエディタ。

(メモ)
この定義付けは最初にエディタで一気にしたほうがいいと思う。なにがなんやらわからんくなる。

次回はこれを使って、散布図を作成してみよっと。

今までのデータを保存して終了。
そうか、でもyome.Rを持ってれば後からそれをコピペすればいいんだ。

R七転八倒