NagoyaRに参加してきました。
NagoyaR #8に参加してきました。
これから業務で R を使っていく(事になるハズ)なので。
前半は「入門者講習」。Evernoteに残したメモをそのまま貼り付けておきます。
- R概論
- 要するに統計ソフト
- 無償、統計処理の種類が豊富、グラフィックスが美しい(VectorGraphics)
- 文字ベース(プログラム感覚→コードシェアという利点)
- 多方面の知識が必要(英語+統計+計算機)
- Excel(やSPSS):高価、Excelの処理ひどい、グラフィックス汚い
- 重大なセキュリティ上の問題が無い限り、むやみに更新しない
- パッケージの動作不良を回避するため
- アンインストール→/Applications以下と、/Library/Framework/R.framework削除
- 終了はq()
- ヘルプはhelp(sth)(例:help(help))(英語)
- 日本語の情報:http://seekr.jp/ から検索(Googleエンジン利用)。
- R-Tips(http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html)
- 関数と変数が命
- 実行あるのみ!
- c()関数(combine):値を1つにまとめる関数
- 代入
- hako <- c(1,2,3,4,5)
- c(6,7,8,9,10) -> hako でも可
- コンソールもーどでの補完はTabキー
- 変数の中にまとめ多数を入れておくと、関数に渡したときに全て処理
- 例:h<-(1,2,3);sqrt(h) #> [1] 1.000000 1.414214 1.732051
- ※関数によって動作は異なる
- sum()関数:合計
- table()関数:度数分布
- 外部データの読み込み
- 行列:Rで複数行のデータを扱うもの、数学の「行列」とほぼ同じ。
- matrix()関数:行列を作る関数。matrix(要素、行数、列数(、方向))
- matrix(vec,nrow=n,ncol=m[,byrow=T/F])
- ※名前付き引数が使えます。
- m[n,]:n行目だけを取り出す
- m[,n]:n列目だけを取り出す
- データフレーム:質的データと量的データが混じってるもの
- Excelのワークシートと同じ概念
- ベクトルを連結したり、行列から変換したりできる
- めんどくさいので「外部データの読み込み」。
- 外部データの読み込み:Excelから読み込んだり
- 行列:Rで複数行のデータを扱うもの、数学の「行列」とほぼ同じ。
- 作図!楽しい作図!
- hist()関数:実行するだけでヒストグラムを表示!
- plot()関数:実行するだけで散布図を表示!
- 名前付き引数でtypeで plot(x,type="l") とすると折れ線グラフ!
- boxplot()関数:実行するだけで箱ひげ図を表示!
- barplot()関数:棒グラフ!
- 作図デバイス:
- pdf():作図デバイスをPDF出力に指定して開く。最後にdev.off()で書き出し
- Rで検定
- 取り敢えず「t検定」
- t.test(group1,group2,var.equal=T/F)
- カイ二乗検定(期待値からのズレ)
- chisq.test(freq,correct=F/T)
- 分散分析
- anova()関数、、、
- よりANOVA君を使おう!
- 取り敢えず「t検定」
- 参考文献
太字の箇所は、講師の匿名希望氏が強調して話してたり楽しそうに話していた箇所です。だったと思います。
後半はLT大会、と言っても、発表者は3人。でも前半の講義が押して時間が遅れ、発表も人によってはLTの枠に囚われない濃い内容(=持ち時間10分を余裕で超えるLightningじゃないTalk)だったりで、いや、あの、良い話は聞けました(^-^)
ただ今回は言語処理の話ばかりで、他の分野(Webサービスとか生物医療とかソーシャルサービスとかWebサービスとか)の話が聞けなかったのが残念。
残念と言えば、今回は参加者が割と少なめで、特に社会人(学生及び研究職以外)は私を含めて2人だけだったような。ついでに理系は全参加者中で私1人だけだったような(^-^;
最後に前半の講師に来てた方と少しだけお話しできたのが、一番の収穫かな。
次回は、何かLTできたらと思ってます。まだRはそんなに活用出来てないかも知れないけれど、それまでに何か話せるネタができていますように。