Cancel

[Statistics] 평균, 분산, 표준편차 (Average, Variance, Standard Deviation)

Posted Jan 28, 2021 2021-01-28T22:03:28+09:00 by da-nyee

Average

평균은 대표값 중 하나이다.
평균은 성과 측정 기준이 될 수 없다.
평균은 데이터의 들쭉날쭉한 정도를 반영하지 않기 때문이다.

average = sum(data) / len(data)

Deviation

deviation[i] = data[i] - average

Squared Deviation

squared_deviation[i] = deviation[i] ** 2

Variance

분산은 데이터의 퍼져 있는 정도를 나타낸다.
분산은 데이터의 들쭉날쭉한 정도를 알아내기 위해 계산한다.
분산이 크다 == 데이터가 넓게 분포한다. 데이터가 들쭉날쭉하다.
분산이 작다 == 데이터가 좁게 분포한다. 데이터가 들쭉날쭉하지 않다.

variance

variance = sum(squared_deviation) / len(squared_deviation)

Standard Deviation

표준편차는 분산에 제곱근(루트)를 취해 줄인 값이다.
표준편차는 평균적인 들쭉날쭉함으로 지표화된다.

from math import sqrt

standard_deviation = sqrt(variance)

Conclusion

데이터(변량) ➡ 평균 ➡ 편차 ➡ 편차제곱 ➡ 분산 ➡ 표준편차

References

TIL, Statistics

statistics average variance standard deviation

This post is licensed under CC BY 4.0 by the author.

Trending Tags

python network git database books writing effective java web spring mvc quizzes

Contents

Trending Tags

python network git database books writing effective java web spring mvc quizzes