Average
- 평균은 대표값 중 하나이다.
- 평균은 성과 측정 기준이 될 수 없다.
- 평균은 데이터의 들쭉날쭉한 정도를 반영하지 않기 때문이다.
1
average = sum(data) / len(data)
Deviation
1
deviation[i] = data[i] - average
Squared Deviation
1
squared_deviation[i] = deviation[i] ** 2
Variance
- 분산은 데이터의 퍼져 있는 정도를 나타낸다.
- 분산은 데이터의 들쭉날쭉한 정도를 알아내기 위해 계산한다.
- 분산이 크다 == 데이터가 넓게 분포한다. 데이터가 들쭉날쭉하다.
- 분산이 작다 == 데이터가 좁게 분포한다. 데이터가 들쭉날쭉하지 않다.
1
variance = sum(squared_deviation) / len(squared_deviation)
Standard Deviation
- 표준편차는 분산에 제곱근(루트)를 취해 줄인 값이다.
- 표준편차는 평균적인 들쭉날쭉함으로 지표화된다.
1
2
3
from math import sqrt
standard_deviation = sqrt(variance)
Conclusion
- 데이터(변량) ➡ 평균 ➡ 편차 ➡ 편차제곱 ➡ 분산 ➡ 표준편차