오차(왼쪽)                           vs                                    잔차(오른쪽)

오차(error)와 잔차(residual)는 모집단을 전제로 하느냐 표본을 전제로 하느냐에 따라 회귀식에서 사용되는 개념이다.

 

왼쪽에 있는 모형은 모집단의 모수식을 표현한 것이다. 즉, 우리가 궁극적으로 알고자 하는 실제의 식인 것이다. 

이때, 모든 data들을 하나의 회귀식으로 100% 설명할 수 없다. 그래서 오차(error)라는 개념이 도입되었고, 이 값은 회귀식의 값과 실제값의 차이를 말한다.

오른쪽에 있는 모형은 표본으로부터 추정한 회귀식을 표현한 것이다. 즉, 우리가 궁극적인 회귀식을 알수 없기에 그것을 추정한 식인 것이다. 이때 잔차(residual)라는 개념을 사용하며, 이 값은 추정된 회귀식의 값과 관측값의 차이를 말한다.

 

추정된 회귀식은 모집단의 실제 회귀식과는 차이가 있을 수 있다. 일반적으로 표본이란 것 자체가 대표성을 갖긴 하지만 모집단 그 자체가 될 순 없기 때문이다. 

 

+ Recent posts