Rでの条件付き合計と条件付き平均の計算
概要
エクセルで言えば、sumif()
やaverageif()
のような関数がたまに必要になる。Rではそうした単純な関数はないが、apply系列の関数が圧倒的に上位互換である。
これらの関数を入念に覚えておくといいが、とりあえずは条件付き合計と条件付き平均を計算してみよう。
例
iris データセットを読み込もう。
ランダムに10番、50番、90番、130番のデータを見ると、種がカテゴリー変数として分類されているのがわかる。各種ごとにSepal.Length
の合計と平均を計算するには、tapply()
関数を使用すればいい。
上の例に示されているように、第一引数には計算するデータ、第二引数には分類基準、第三引数には合計または平均を記述する。