Rで栄養統計を学ぼう!第1回:RとRStudioをインストールしよう

R言語

今回から新連載のスタートです。

第して、「Rで栄養統計を学ぼう!」です。

連載を順番にご覧いただくことで、Rや統計学に関する基本的な知識の習得はもちろん、栄養学特有の統計解析も行えるようになります。

連載初回である今回は、Rとは何かという点と、なぜRを学ぶのかについての解説、RとRStudioのインストールを行っていきたいと思います。

ではいきましょう!

 

「R」って何?

はじめに、Rとは何か、という点について解説していきます。

Rとはなにか、Rの公式ホームページから引用してみます。

R is a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS.

引用)https://www.r-project.org/

英語なので、何言ってるのかわからないですよね。翻訳すると、

「Rは、統計的計算およびグラフィックス用のフリーソフトウェア環境である。 これは、さまざまなUNIXプラットフォーム、WindowsおよびMacOS上でコンパイルおよび実行される。」

簡単にいうと、Rは統計を行うためのソフトウェアのことです。Rというプログラミング言語で記述することで、様々な統計解析が可能になります。

 

どうしてRを学ぶの?

では、どうしてRを学ぶ必要があるのでしょうか。

確かに、世の中には様々な統計ツールがあります。Excelだって広義ではそうですし、SPSSやSASなどもあります。R以外にも、優れた統計ツールは山のようにあります。

それなのに、なぜRを学ぶのでしょうか。それには以下の3つの理由があります。

  1. 無料で使える
  2. スクリプトで扱える
  3. 高度な統計手法が使える

①無料で使える

無料で使えるというのは、非常に大きな、Rを使用するメリットとなりえます。先ほど紹介した3つの統計ツールは、いずれも有料です。特に、SPSSやSASは、契約形態などによっては非常に高額になります。

そのため、それらの使用法を大学などで学んだとしても、大学を卒業した後に個人でそれらを買い揃えるのは現実的ではありません。それでは、せっかく学んだ統計学の知識も、活用できなくなります。

その点、Rは無料で利用できますので、個人の環境などにとらわれることなく、提供される限りは使用することができるのです。

②スクリプトで扱える

スクリプトで扱えるというのも魅力的なポイントです。

Rは、すべての操作をスクリプトで行います。これは、Rの敷居の高さにもつながっていますが、その一方でメリットも提供しています。

それは、コードを再利用できたり、統計分析の過程が可視化されるといった点です。

ExcelやSPSSなどのGUI(いわゆる、マウス操作)のソフトウェアで解析を行った場合、同じ解析をするためには、また同じ操作を繰り返す必要があります。また、少し条件を変えて解析を行いたいという場合でも、同様の操作を繰り返さなければなりません。つまり、それらのソフトウェアを使用した場合、同じ処理を再度行うなどが難しくなります。

その点、Rでは、コードを書いて統計解析していくため、再利用が容易です。同じ処理を何度でも繰り返せますし、少し条件を変えたいといった場合でも簡単です。

また、統計分析の過程が可視化されるのも、Rを利用するメリットです。GUIで統計解析した場合には、どんな操作を行ったのか、後から確認したいと思っても難しいです。しかし、Rでコードを書いて行う場合、コードを読んでいくことで、どんな操作を行ったかが一目瞭然です。この点も、Rを使用するメリットの1つです。

③高度な統計手法が使える

Rでは、非常に多くな統計手法が扱えます。そして、その数はどんどん増えていっています。

Excelで統計解析をしたいと思った場合、平均値の算出やt検定、簡単な回帰分析などであれば可能ですが、多変量解析なんかになってくると不可能です。

高度な統計解析手法を利用できるのが、Rを利用するメリットです。

 

RとRStudioをインストールしよう!

では、さっそく、Rをインストールしていきましょう。今回は、Rだけでは変数の状態が見にくかったりして、コードを書いていくのは不便なので、R言語の総合開発環境である「RStudio」もインストールしていきたいと思います。

まずはRのインストールから

以下のURLからRをインストールできます。

The Comprehensive R Archive Network

URLを開き、それぞれのOSに応じたRのインストーラをダウンロードしてください。

私のPCのOSはWindowsなので、Windowsの項目をクリックします。

 

クリックすると、Windows向けのページが表示されますので、次は「base」をクリックしてください。

 

baseのダウンロード画面が表示されますので、最新版をダウンロードしてください。

 

ダウンロードされたインストーラを起動し、Rをインストールしてください。基本的な設定はそのままで構いません。

その場合、デスクトップにRへのショートカットが作成されていますので、そこからRを利用できます。

次はRStudioのインストール!

では、次はRStudioをインストールしましょう。以下のURLにアクセスしてください。

Download RStudio
Choose Your Version of RStudio RStudio is a set of integrated tools designed to help you be more productive with R. It includes a console, syntax-highlighting ...

各自のOSにに合致したインストーラをクリックしてください。すぐにダウンロードが始まります。

ダウンロードしたインストーラを起動してくださいこちらも、基本的にすべてOKを選択して構いません。これで、RStudioのインストールもできました!

RStudioを起動してみよう

では、RStudioを起動してみましょう。アプリの一覧にあるかと思いますので、そちらから起動してください。

以下のような画面が起動するかと思います。

コードを書いてみよう

では、せっかくなので、コードを書いてみましょう。

最初なので、1+1を計算し、その結果を出力してみましょう。

コードは以下の場所に書いてください。

左上のウインドウがコードを書いていく場所です。

そして、Ctrl+Shift+Enterでコードを実行できます。その結果は、左下のウインドウに表示されますので、確認してみましょう。

以下のような結果が出力されましたでしょうか。

 

まとめ

今回は、とりあえずこれで終了です。

RとRStudioのインストールを行い、簡単なコードを実行してみました。

次回は、データから、平均値などの記述統計量を算出してみたいと思います。

 

連載目次