Posts [Statistics] 평균, 분산, 표준편차 (Average, Variance, Standard Deviation)
Post
Cancel

[Statistics] 평균, 분산, 표준편차 (Average, Variance, Standard Deviation)

Average

  • 평균은 대표값 중 하나이다.
  • 평균은 성과 측정 기준이 될 수 없다.
  • 평균은 데이터의 들쭉날쭉한 정도를 반영하지 않기 때문이다.
1
average = sum(data) / len(data)

Deviation

1
deviation[i] = data[i] - average

Squared Deviation

1
squared_deviation[i] = deviation[i] ** 2

Variance

  • 분산은 데이터의 퍼져 있는 정도를 나타낸다.
  • 분산은 데이터의 들쭉날쭉한 정도를 알아내기 위해 계산한다.
  • 분산이 크다 == 데이터가 넓게 분포한다. 데이터가 들쭉날쭉하다.
  • 분산이 작다 == 데이터가 좁게 분포한다. 데이터가 들쭉날쭉하지 않다.

variance

1
variance = sum(squared_deviation) / len(squared_deviation)

Standard Deviation

  • 표준편차는 분산에 제곱근(루트)를 취해 줄인 값이다.
  • 표준편차는 평균적인 들쭉날쭉함으로 지표화된다.
1
2
3
from math import sqrt

standard_deviation = sqrt(variance)

Conclusion

  • 데이터(변량) ➡ 평균 ➡ 편차 ➡ 편차제곱 ➡ 분산 ➡ 표준편차

References

This post is licensed under CC BY 4.0 by the author.