정규 분포를 이용한 오차 모델링 – rnorm() 함수 활용
정규분포와 잡음(오차) -> runif 모델링 시 만들어 놓은 수식이 실생활을 잘 묘사해야 하지만 runit 함수는 그렇지 않다 -> 정규분포
정규분포와 잡음(오차) -> runif 모델링 시 만들어 놓은 수식이 실생활을 잘 묘사해야 하지만 runit 함수는 그렇지 않다 -> 정규분포
# -5~5함수 rnorm().0을 중심으로 좌우로 이동하기 때문에 unif*10-5에서 -5를 이용하여 이동할 필요가 없어짐. -5
오차범위를 더 크게 흔들리게 만들기도 한다.
dnorm()을 사용한 정규 분포의 이해
평균:분포 및 가능도함수의 중심결정분산(표준편차):분포의 확산, 가능도함수의 확산, 정규분포를 구현하는 함수 2종류의 sample 추출 rnorm() 가능도함수 정보를 담는 dnorm() dnorm():density 밀도 ‘d’ 가능도함수 정의 0을 닮은 아이가 많이 나오고, 0을 벗어날수록 그 빈도가 적어진다.실제로 sample을 뽑아도 그렇게 될까?
우리가 그린 가능성 함수 sample을 뽑으면 나오는 숫자 정보가 잘 담겨 있다.
평균과 분산 -> 가능도 함수?dorm함수 usagemean과 sd가 정해져 있는 dnorm(x,mean=0,sd=1) 바꿔서 그리면 어떻게 되는가?
평균과 분산 -> 가능도 함수?dorm함수 usagemean과 sd가 정해져 있는 dnorm(x,mean=0,sd=1) 바꿔서 그리면 어떻게 되는가?
평균은 가능성 곡선의 중점을 결정한다. 가능성 곡선은 중점을 기준으로 대칭이다.분산(표준편차)을 바꾸어 그리면 어떻게 되는가?
빨간색을 따르는 정규분포에서 난수를 빼면 상대적으로 더 높은 확률로 0 가까이에서 값이 나온다.->rnom()을 사용하여 확인청색의 가도함수를 갖는 정규분포로부터 샘플을 10개 선택했다.적색 가능도 함수를 가지는 정규 분포로부터 샘플을 10개 선택했다.이거 찍어볼 수도 있어.검은색 가능도 함수를 가진 정규 분포에서 샘플을 골랐는데, 여러 개가 0 근처에서 선택되고 0에서 멀어질수록 더 적은 개수가 선택된다.2가까이 뽑힌 sample이 만약 흑색의 가도함수가 아닌 청색의 가도함수에서 뽑힌 것이라면 매우 드문 확률이 발생한 것을 알 수 있다. 대부분 가능성도 곡선에 0에 가까워 거의 선택되지 않기 때문이다.청색 가능도 함수를 갖는 정규 분포로부터 선택한 샘플은 상대적으로 0에 의해 집중되어 있는 것을 알 수 있다.