정확한 메달 수 예측 모델을 훌쩍 뛰어넘는 한국의 동계올림픽 메달 수

최근 두 통계학자가 동계 올림픽 메달 수를 예측할 수 있는 통계 모델을 발표했습니다. fastcodesign의 기사에 따르면 미국 대선을 정확히 예측한 Nate Silver의 영향을 받은 Dan 과 Tim Graettinger 형제는 2010년 동계 올림픽 메달 집계를 시청하던 중 메달 집계를 통계학적으로 예측할 수 있는 모델을 만들려는 생각을 갖게 됩니다. 이후 4년동안 이들은 30종 이상의 dataset을 이용하여 수없이 회귀분석을 반복한 끝에 실제 결과에 가장 근접한 결과치를 찾게 됩니다. 수집된 정보는 경제, 지리적 요건, 종교, 사회정치적인 요인 등 다양한 분야에 걸쳤습니다. 최종 모델에서는 단 4개의 변수만이 일관성 있게 예측을 도왔는데, 이들은 국가의 영토 면적, 1인당 GDP, 수출액, 그리고 수도가 위치한 곳의 위도였습니다.


이 메달 수 예측 모델은 2006년과 2010년 동계 올림픽 참가국의 메달 획득 수를 3개의 오차 내에서 예측합니다. 하지만 예외가 되는 나라가 있으니, 바로 한국입니다. 대한민국은 정확한 메달 수 예측 모델보다 2006년과 2010년 각 해에 무려 8개나 많은 메달을 땄습니다. 그리고 바로 이 점이 이들 형제를 고심하게 만들었습니다. Graettinger 형제는 한국이 특히 쇼트트랙에 강하기 때문에 이러한 결과가 나왔다고 결론을 지었습니다 (This nation over-performed by about 8 medals in both 2006 and 2010.  How do you account for the fact that short-track speed skating is hugely popular there, and they routinely win lots of Olympic medals in that discipline?).

하지만 쇼트트랙이 한국에서 인기가 있다는 이유로 이러한 결과가 나왔다기보다는 이 모델에서 가장 중요한 변수들이 영토면적과 1인당 GDP 등인점을 감안할 때 대한민국 국민들이 전반적을 뛰어난 자질을 가지고 있고, 한국의 경제력에 비해 대표 선수들에 대한 지원이 훌륭하고, 또한 대한민국 선수단이 전반적으로 이러한 다른 나라 선수들보다 뛰어난 정신력과 실력을 갖췄기 때문이 아닌가 생각됩니다.

Graettinger 형제의 메달 수 예측 모델에 따르면 9개의 메달을 획득해서 메달 수 집계에서는 16위가 될 것으로 예측되었습니다. 아마 올해 동계 올림픽에서도 한국은 통계학적인 예측을 쉽계 뛰어넘는 괴력을 발휘할 것으로 믿어집니다.

참고>> Discovery Crops Inc.: Using Data Mining to Predict the Winter Olympics Medal Counts in Sochi

참고>> fatcodesign: Can This Clever Statistical Model Predict Olympic Medal Winners?