【R×栄養統計】四則演算と代表値の算出をやってみよう

みなさん,こんにちは。
シンノユウキ(shinno1993)です。

今回は,まず足し算や割り算などの基本的な計算の方法をまず学習します。その次に,平均値や最頻値などの代表値を算出する方法をご紹介します。

コードもたくさん書いていきますが,頑張っていきましょう!

スポンサーリンク

まずは四則演算から!

まずは,簡単な四則演算からやっていきます。足し算・引き算・掛け算・割り算です。これらは非常に簡単です!

#足し算は+で
> 1+1
[1] 2

#引き算は-で
> 2-1
[1] 1

#掛け算は*で
> 1*2
[1] 2

#割り算は/で
> 2/2
[1] 1

こちらは特に迷うことはないですよね。Excelなどで使用する四則演算と同じ記号を使います。基本として抑えておきましょう。

代表値を算出してみよう!

では,次は代表値を算出してみましょう。

代表値とは?

代表値には,大きく分けて以下の3つがあります。数値の分布における集団的特徴を表現するために用いられます。

  • 平均値:n個のデータがあった場合,それぞれのデータの値を合算し,データの個数であるnで割った値です。
  • 中央値:n個のデータを小さい方から順番に並べた場合に,その中央に値する数値のことです。
  • 最頻値:n個のデータがあった場合,その中で最も多く出現する数値のことです。

では,さっそく,Rで代表値を算出してみましょう。

そのまえに,サンプルとなるデータを入力しておきましょう。まずは,以下のコードを記述してください。

test <- c(1,2,3,4,5,5,6)

このコードでは,testという変数に,1,2,3,4,5,5,6の値を代入しています。

変数というのは,データを入れるための箱になるようなもののことです。変数 <- 代入する値 で変数に値を代入させることができます。

c()は関数で,引数として入力した数値を結合させ,ベクトルとするという働きがあります。以下のように使用します: 変数名 <- c(数字のリスト)

ちなみに,cはcombineの略です。

なお,Rでは,複数の値を縦または横に並べたものをベクトルといいます。また,単一の値のことをスカラーと呼びます。この辺りの理解は少し難しいところがあるのですが,こんな言い方をするんだなーと一応頭の片隅の置いておいてください。ちなみに,先ほど作成した変数testは,複数の値を持ちますのでベクトルです。

では,このデータの代表値を算出してみましょう。

平均値

平均値を算出するためには,mean関数を用います。mean関数の使い方は以下の通りです: mean(ベクトル)

なので,testの平均値は,以下のように算出されます。

> mean(test)
[1] 3.714286

中央値

中央値を算出するためには,median関数を用います。median関数は以下のように使用します: median(ベクトル)

なので,testの中央値は,以下のように算出されます。

> median(test)
[1] 4

最頻値

Rでは,最頻値を算出する関数はありません。

そのため,どの数値が何度出現したかを表現できる,table関数を用います。以下のように使用します: table(ベクトル) test変数で使用すると以下のような結果になります:

> table(test)
test
1 2 3 4 5 6 
1 1 1 1 2 1

この場合,123456というのが,testに含まれている数字の一覧で,その下が,それらの数値が何回出現したかを示す度数です。

今回の場合は5の下にある2が最も頻度が高いということになりますので,testの最頻値は5ということになります。

まとめ

今回は,Rにおける四則演算と代表値を算出する方法について紹介しました。

それぞれの指標の解説はかなり少なくなってしまいましたが,まずはコードを書いて使えることも重要だと思います。頑張ってマスターしましょう。

連載目次

  1. 【R×栄養統計】RとRStudioをインストールしよう
  2. 【R×栄養統計】四則演算と代表値の算出をやってみよう現在のページ
  3. 【R×栄養統計】データの読み込み方法を習得しよう【TXT・CSV,・XLSX】
  4. 【R×栄養統計】性別と肥満度に関係があるか?カテゴリデータの栄養統計
  5. 【R×栄養統計】正規分布しているか?正規性を確認する方法を紹介します
  6. 【R×栄養統計】男女でエネルギー摂取量に差はある?対応のない2群間の栄養統計
  7. 【R×栄養統計】栄養指導に効果はあった?対応のある2群間の栄養統計
  8. 【R×栄養統計】食べる速さでエネルギー摂取量に差がある?対応のない多標本の栄養統計
  9. 【R×栄養統計】多重比較を行う理由と使い分けを紹介|検定の多重性問題
  10. 【R×栄養統計】どの群間に差がある?対応のない多標本における多重比較
タイトルとURLをコピーしました