RとRStudio

R言語の使い方

(Press ? for help, n and p for next and previous slide)

村田 昇
2019.09.27

R言語の概要

R言語とは

  • 統計計算のための言語と環境の総称
  • オープンソース・フリーソフトウェア
  • パッケージ のインストールによって容易に機能の拡張が可能
    • パッケージの開発は非常に活発 (現在10000を越える)
    • 最新の技術や方法が簡単に導入できることも多い
  • R Project https://www.r-project.org/

RStudioとは

  • RStudio社により開発・公開されているR言語のための統合開発環境(IDE)
    • Rによるデータ解析や統計計算・パッケージ開発等を支援
    • OSに依存しない対話型操作環境を提供
  • RStudio社 https://www.rstudio.com
  • 本講義ではRStudioを用いて説明を行う

R言語の得意分野

  • データの分類・集計・整理
  • 記述統計量 (基本・要約統計量とも言う) の計算
  • グラフによる視覚化
  • プログラムによる処理の自動化
  • 確率的シミュレーション (モンテカルロ法)

インストール

Rのインストール手順

  • R: The R project for Statistical Computing にアクセス
  • download R というリンクをクリック
  • CRANのミラーサイトを選ぶ:
    • どれでも利用可だが “Japan” のいずれかを選ぶと良い
    • OSごとにインストール方法が異なるので注意

Windowsの場合

  • Download R for Windows をクリック
  • base をクリック
  • Download R(バージョン)for Windows をクリック
  • ダウンロードされたインストーラを起動
  • 指示に従って R をインストールする

Macの場合

  • Download R for(Mac)OS X をクリック
  • R-(バージョン).pkg をクリック
  • ダウンロードされたインストーラーを起動
  • 指示に従って R をインストールする
  • (Homebrewを利用することも可能)

RStudioのインストール手順

  • Download RStudio – RStudio にアクセス
  • Installers for Supported Platforms から自分の環境(OS)に合わせてインストーラを選択
  • ダウンロードしたインストーラを起動
  • 指示に従って RStudio をインストールする

基本操作

起動と終了

  • 以下 RStudio を用いて説明する
  • 起動すると標準的な設定では4つのペイン(枠)を持つウィンドウが立ち上がる
    • 左上: エディタ
    • 左下: コンソール
    • 右上: 作業環境内の変数・コマンド履歴
    • 右下: パッケージ・グラフィックス・ヘルプ
  • ペインの配置や数は個別に設定することもできる

コンソール (左下のペイン)

  • プログラムを実行するコマンドを入力する
  • 例えば,以下のように簡単な計算を行うことができる

    1 + 2 + 3 + 4 
    
  • コンソール上で終了を指示する以下のコマンドを入力すればRを終了させることができる

    q()
    

演習

  • RStudioを起動してみよ
  • 上記の方法で終了してみよ

終了時の注意

  • R終了前に以下のメッセージが表示される場合がある

    Save workspace image? [y/n/c]:     
    
  • 作業で使われた変数などをセーブするか尋ねている
    • y を入力: セーブする (yesの略)
    • n を入力: セーブしない (noの略)
    • c を入力: Rの終了をキャンセルする (cancelの略)
  • セーブした場合次回起動時に読み込まれる

エディタ (左上のペイン)

  • コマンドを記述したファイルを扱う
  • コンソール上に入力したコマンドは直ちに実行されてしまう
  • 複雑なコマンドを書いたり,後から一部を修正するための機能
    • コマンドを実行順に記述したファイルを作成 (R Script)
    • ファイルを保存
    • ファイルを実行
  • 演習を行いながら上記の操作は説明する

基本的な使い方

式の入力

  • 四則演算や一般的な関数が計算可能
    ほぼ直感に沿った文法で書くことができる
  • 加算:+,減算:-,乗算:*,除算:/,羃乗:^または**
  • コンソールでの実行例:

    1*2+3^2
    1*2+3#^2 # 以降は実行されないのでコメントとして利用できる
    
    [1] 11
    [1] 5
    

演習

  • 以下の式を R を用いて計算してみよう
    • \(123\times456-789\)
    • \((2^{2^5}+1)\div641\)
    • \(\sin^2(\pi/3)+\cos^2(\pi/3)\)

エディタからの実行

  • 新規ファイルの作成: (以下のいずれか)
    • 左上の “+” から “R Script” を選択
    • “File’’ から ”New File’’ を選択,更に “R Script” を選択
  • コマンドやコメントの入力:
  • 実行範囲の選択:
    • 一行のみ: カーソルをその行に移動
    • 複数行: ドラッグして範囲を選択
  • 選択範囲の実行: (以下のいずれか)
    • ツールバー内の “Run” をクリック
    • “Code” から “Run Selected Line(s)” を選択
    • Ctrl/Command+Enter (Run the current line or selection)

ファイルの保存

  • ファイルの保存: (以下のいずれか)
    • ツールバーのディスクのマークをクリック
    • “File” から “Save” を選択
    • Ctrl/Command+S (Save)
  • ファイル作成に関する注意:
    • 初めて保存する時にファイル名の入力が求められる
    • 拡張子は通常 “.R” または “.r” を利用する
    • # 以降に入力された文字列は実行されない(コメントアウト) コマンドに対するコメントを残す際に有用

演習

  • 先程の演習の内容をファイルに保存してみよう
    • \(123\times456-789\)
    • \((2^{2^5}+1)\div641\)
    • \(\sin^2(\pi/3)+\cos^2(\pi/3)\)

関数の実行

  • 関数の取り扱いは一般的な計算機言語とほぼ同様
    • 関数は引数とその値を指定して実行
    • ただし引数名は順序を守れば省略可能
  • 関数の書き方:

    f(arg1=value1, arg2=value2) 
    # arg1, arg2 は引数の名前,value1, value2 は引数に渡す値を表す
    f(value1, value2) # 上と同値
    

演習

  • 以下の例を確認してみよう
    • 例1: 正弦関数の計算:

      sin(x = pi/2)
      sin(pi/2) # 上と同値
      
    • 例2: 対数関数の計算: (xやbに適当な数値を代入せよ)

      log(x, b) # 底をbとする対数
      log(x=x, base=b) #上と同値
      log(base=b, x=x) #上と同値
      log(b,x) # = log(x=b,base=x) 
      log(x) # 自然対数 =log(x,base=exp(1))
      

ヘルプ機能

  • 各関数の詳細(機能,引数名,引数の既定値,例など)を記述したヘルプファイルが用意されている
  • ヘルプファイルに関連する関数:
    • help (使い方や例の表示)
    • example (例を実際に実行してくれる)
    • help.search (キーワード検索)
  • 右下のペインの“Help”タブの右上にある検索バーに関数名を入力することでも参照可能

ヘルプの実行例

  • ヘルプは右下のペインに表示される

    help(log) # 関数logのヘルプ
    ?log # 上と同値
    example(log) # ヘルプ内の例を実行
    help.search("log") # "log"に関連する項目は?
    ??"log" # 上と同値
    

演習

  • 以下の項目についてヘルプを利用してみよう
    • 三角関数(trigonometric function)を計算するための関数についてのヘルプファイルを調べよ
    • 双曲線関数(hyperbolic function)についても調べよ

オブジェクト

  • Rで扱うことのできる数値:
    • 実数および複素数 (指数表記にも対応)
    • 無限大や不定な数など特殊なものにも対応
  • 変数,関数,計算結果などを オブジェクト と呼ぶ
  • オブジェクトには名前を付与すること(代入)ができる
  • オブジェクトの内容は右上“Environment”タブで確認することができる

演習

  • 以下の代入操作を実行してみよう

    (foo <- 3)
    bar <- sin(2/3*pi) + cos(foo * pi/4)
    print(bar)
    
    [1] 3
    [1] 0.1589186
    

パッケージの操作

  • 機能を拡張するために多数のパッケージが用意されている
  • パッケージのインストール方法:
    • RStudioの機能を利用する方法
    • コンソールから行う方法
  • RStudioの機能を利用したインストール手順:
    • 右下ペインの“Package”タブをクリック
    • 左上の“Install”をクリック
    • パッケージ名を入力し“Install”をクリック
  • パッケージの情報は右下“Package”タブで確認できる