2018. 4. 17. 08:38 IT/R
정규분포에서 확률구하기
1. 정규분포에서 확률구하기
통계학의 모든 분야에서 가장 중요하게 생각되는 대표적인 연속확률 분포는 정규분포이다.
정규곡선이라 불리는 정규분포의 확률밀도함수는 좌우 대칭의 종모양 곡선이다
정규확률변수의 확률분포에 대한 수학적 방정식은 아래와 같다
정규분포에서 μ와 σ^2이 가지는 의미를 살펴보면 μ는 확률분포의 중심위치를 나타내고
σ^2은 정규곡선이 퍼져있는 정도를 나타낸다
μ와 σ^2에 따라 다양한 모양으로 나타나는 정규분포 중에서 평균이 0이고
분산이 1인 정규분포를 표준정규분표라 한다.
일반적으로 표준정규분포를 따르는 확률변수는 Z로 표현하는데,
Z ~ N(0,1)이므로 확률변수 Z는 E(Z) = μ = 0을 중심으로 좌우대칭인 정규분포를 따르며, 분산 Var = (Z) = σ^2 = 1 과 같다
정규분포의 특징 중 하나는 정규분포를 따르는 확률변수에 상수를 이용한 사칙연산을 하더라도 여전히 정규분포를 따른다는 것이다. 확률변수 X를 평균이 0이고 분산이 1인 확률변수 Z로변환하는 과정을 표준화변환이라고 한다.
1) R 프로그래밍 실습
R 프로그램 내장함수 중 pnorm을 이용하면 정규분포에서의 확률을 쉽게 계산할 수 있다
구문 형식은 아래와 같다
pnorm(x, mean = 0, sd = 1, lower.tail = TRUE)
이며, 여기서 x는 확률변수 X의 특정값을 의미한다.
이들 값을 입력하지 않으면 표준정규분포에서의 확률을 계산해준다.
lower.tail은 확률계산의 방향을 선택하는 옵션으로 그 값을 TRUE(또는 T)로 설정하면
P(X ≤ x) 가 계산되고, FALSE(또는 F)로 하면 P(X ≥ x)가 계산되며,
기본값은 TRUE이므로 TRUE(또는 T)로 설정 시에는 생략 가능하다.
2) 문제
LCD 제조회사에서 생산되는 패널의 수명시간은 정규분포를 따른다고함
생산되는 LCD패널에 대한 평균 수명시간은 3000시간 이라 할 때 임의로 선택한
LCD 패널 1개의 수명시간이 2948 ~ 3080 시간 사이일 확률을 구하여라
> avg = 3000
> sigma = 80
> x1 = 2948
> x2 = 3080
> pnorm(x2,mean=avg,sd=sigma) - pnorm(x1,mean=avg,sd=sigma)
[1] 0.5834986
> z1 = (x1-avg) / sigma
> z2 = (x2-avg) / sigma
> pnorm(z2) - pnorm(z1)
[1] 0.5834986
'IT > R' 카테고리의 다른 글
R invalid factor level, NA generated 오류해결 (0) | 2020.01.18 |
---|---|
이항분포의 정규근사 (0) | 2018.04.17 |
이항분포를 활용한 R프로그램 (0) | 2018.04.04 |
도수분포표, 상대도수 구하기 (0) | 2018.03.27 |
R 스튜디오 설치하기 (0) | 2017.12.04 |