본문 바로가기

통계

추리 통계의 기초

- 정규분포가 중요한 이유는?

  • 대부분의 데이터가 정규분포를 이룬다.
  • 종속변수가 양적데이터일 때 '모집단'은 정규분포를 이룰 것이라 가정한다
  • 정규분포를 이룬다면 여러 추론이 가능하다
  • 표본을 무한히 많이 추출하면 이론적으로 표본들의 평균이 정규분포를 이룬다.

- 정규분포 특징

 

 

  • 정규분포를 이룬다면 확률밀도함수에 의해 사례가 몇 퍼센트 확률로 그곳에 위치할 지 예측할 수 있다!
  • 정규분포에서는  μ ~ μ+kσ의 확률이 μ,σ에 상관없이 동일하다

- 표준정규 분포

 

  • 평균이 0이고 표준편차가 1인 정규분포(z분포)
  • 아래는 표준화 공식이다. 모든 값을 x에 대입하여 표준화를 한다.

본 공식에 의해서 평균을 x에 대입해보면 0이 되고 시그마만큼떨어진 수를 대입하면 1된다.

다르게 설명하면 이렇다.

(내가 이해한 바로는) 표준화 공식은 데이터를 '평균에서 표준편차의 몇배만큼 떨어졌다고 보겠다' 라는 방식으로 가공하는 것이다. 표집된 모든 데이터에 같은 상수를 n을 더해도 평균은 변하지만 표준편차는 변하지 않는다. 하지만 모든 데이터에  n배를 하면 표준편차는 n배 만큼 변화한다. 그러므로 '데이터-평균'의 부분에서는 표준편차가 변하지 않지만 '1/표준편차'를 가하는 연산부분에서 표준편차가 1/표준펴차배로 변화하는 것이다. 따라서 1이된다. 

  • 각 부분에 속할 확률은 아래와 같다

 

 

'통계' 카테고리의 다른 글

불편파 추정치  (0) 2021.01.19
가설검증  (0) 2021.01.18
표집 분포  (0) 2021.01.18