相関

相関係数

  • 相関係数は、2つデータ群間の相関関係の強さを表す指標
  • 相関係数は、共分散を標準偏差の積で割ることで算出
  • 相関係数が、1もしくは-1に近ければ相関が高い。
  • データ群によるが、0.6or-0.6程度の分散では相関はないと判断する。
\[r_{xy} = \frac{\displaystyle \sum_{i = 1}^n (x_i - \overline{x}) (y_i - \overline{y})}{\sqrt{\displaystyle \sum_{i = 1}^n (x_i - \overline{x})^2}\sqrt{\displaystyle \sum_{i = 1}^n (y_i - \overline{y})^2}}\]

変動係数

  • 標準偏差を平均値で割った値
  • スケールの異なるデータのばらつきを相対値で評価するために使用する。
\[C_v = \frac{\sqrt{\displaystyle \frac{1}{n} \displaystyle \sum_{i = 1}^n (x_i - \overline{x})^2}}{\overline{x}} \]