Rを用いた
データ解析の基礎と応用
これは2021年度版です! 最新版はこちら。
※ Step 0 ~ 5をクリックするとスライドが表示されます
Step 0:まずは準備しよう!
- 実習までに行うこと(RとR Studioのインストール)
- 実習について
Step 2:データを可視化しよう!
- データ可視化の重要性
- ggplot2でデータを眺めよう
- geom_histogram ヒストグラム
- geom_density 密度分布
- geom_point 散布図
- aes(color) 色を表現する
- facet_wrap, facet_grid グラフを分ける
- geom_boxplot 箱ヒゲ
- theme_*** 全体の雰囲気を変える
- color(aesの外) 線を特定の色にする
- fill(aesの外) 特定の色で塗りつぶす
- color(aesの中) 線を値に応じた色にする
- coord_cartesian 軸の範囲を変える
- labs タイトルや軸ラベルを書く/書き換える
- theme 文字の大きさなどを細かく設定
- ggsave()
図をファイルとして保存
- その他のグラフの描き方を知りたい方は
Step 3:データを解析しよう!
- dplyrでデータを解析しよう
- head() データをざっくり眺める
- str() データの変数をリストアップする
- select() 指定した列を抽出する
- filter()
特定の値の行を抽出する
- filter(【列名】 %in% c(【値1】, 【値2】)) 複数の値
- filter(【列名】 > 【値】) 比較演算子
- filter(【列名A】 > 【値】, 【列名B】 > 【値】) 複数条件(AND)
- filter(【列名A】 > 【値】| 【列名B】 > 【値】) 複数条件(OR)
- mutate() 新しい列を作る/既存の列の値を変更する
- summarize() 数値を要約する
- group_by() 特定のグループに分けて要約する
- across() 複数条件の要約を短く書く
- bind_cols, bind_rows
複数のデータフレームを結合する
- その他便利な関数を探したい方は
- tidyrでデータを使える形に変形しよう
- pivot_wider() 縦長のデータを横広に
- pivot_longer() 横広のデータを縦長に
- separate() 文字列カラムを複数に分割
- unite()
複数の文字列カラムを結合
- その他便利な関数を探したい方は
- ggplot2の実例
Step 4:自分のデータを扱おう!
- 整然(tidy)データとは何か
- readrで自分のデータを読み込もう
- read_csv() CSVファイルの読み込み
- write_csv() CSVファイルの書き出し
Step 5:統計解析をしよう!
- 統計解析の世界
- 母集団と標本
- 応答変数と説明変数
- 質的変数と量的変数
- 統計解析法の選び方
- 仮説検定と統計モデリング
- 統計的仮説検定
- 統計的仮説検定の考え方
- p値をどのように求めるか1
- 確率分布
- p値をどのように求めるか2
- さまざまな検定統計量
- 統計解析の心構え
- 仮説検定のよくある間違い
- 統計的仮説検定の選び方
- 統計的仮説検定の進め方
- 2群の比較
- 多群(3群以上)の比較
- 統計モデリング
- 割合の検定
著者について
- 石川
由希(名古屋大学生命理学)
- 名古屋大学 理学研究科 生命理学専攻 講師
- 専門:進化生物学、神経行動学