E,AHRSS

확률론

last modified: 2015-03-18 09:30:15 Contributors

確率論
그냥 실해석학 꿈도 희망도 없어
확률의 해석학적 접근을 다루는 학문.

확률론은 20세기 들어 급격히 발달한 학문으로, 역사는 짧은 편이다. 그도 그럴 것이, 유럽 근대는 데카르트의 손바닥 안에서 놀던 시절인데, 데카르트는 연역논리주의자였다. 연역논리로 인한 확실한 것만 취급하였고, 실제 거의 확실한것은 거의 확실히 거짓이다. 라는 명언(?)을 남기며 완전히 확실한 것만을 취급할 것을 요구했다. 확률적인 접근 자체를 불허했던 것이다. 결국, 그렇게 사람들의 관심을 받지 못하다가 20세기 들어 근대에서 현대로 패러다임이 바뀌면서, 그리고 나찌가 유대인을 미쿡으로 죄다 몰아낸 이후학문의 중심이 유럽에서 미국으로 이동하면서 확률에 대한 이론이 정립되기 시작하였다. 참고로, 베르누이의 경우 오늘날 매우 간단히들 생각하는 베르누이 시행을 무려 40페이지가 넘는 분량으로 설명하였다. 데카르트 전통하에서 완전히 새로운 개념이며, 심지어 반대되기까지 하는 것이었으니 역사적 상황을 고려하고 본다면 당연해보이지만...확률개념을 원래 주어진 것처럼 당연하게 여기는 오늘날 현대인들 입장에서는 그렇게까지 해야만 했을까 이해하기가 힘들다. 어쨌건, 이처럼 새로운 개념들에 접근하여 그것을 탄생시키는 과정은 그게 아무리 간단해보일지 몰라도 매우 힘들다는 것만 알고 넘어가자.

기초통계나 수리통계 과목을 들은 사람들이 여세를 몰아 통계학을 더 깊이 봐야겠다 싶어서 확률론을 듣게 된다면 공부를 시작함과 동시에 약간 당혹스러울 것이다. 그도 그럴것이, 확률론은 해석학에 가까운 학문이지, 통계와 직접적으로 궤를 같이 하며 진행되는 과목이 아니기 때문이다.

기본적으로 실해석학의 기초인 측도이론 (Measure theory) 가 잘 정립된 후 수강하는 대학원 레벨 혹은 학부 끄트머리 과목이며, [1] Kolmogorov [2] 라는 수학자가 디자인한 정리를 배우는 과목이라고 보시면 되겠다.[3] 참고로, 이 콜모고로프라는 사람은 20세기 러시아의 수학자로 수학의 거의 전분야에 손을 대고 업적을 세웠던 사람이다.

참고로, 측도이론은 간단히 말하자면 길이나 넓이따위에 관한 이론이다. 19세기까지 수학자들의 관심은 재미있는 모양의 도형등을 주면 그것의 넓이를 어떤방법으로 구할것이냐에 관심을 쏟았는데, 측도이론은 여기서 한차원을 끌어올려, 평면상의 모든 도형의(그러니까, R^2 의 임의의 부분집합) 넓이를 구하는것이 가능한가라는 질문에서 시작한다. 그리고, 답을 구했는데 불가능이다. 삼차원상으로 확장해서 말하자면, 쪼개기와 회전, 그리고 평행이동만을 이용해서 거대한 코끼리를 작은 주사위만하게 만들수도 있다는 결론이 도출되었다.(바나하-타르스키의 역설)

측도론은 르벡과 보렐등의 프랑스 수학자들로부터 시작되었는데, 프랑스 수학자들은 독일식의 공리적 접근 자체를 좋아하지 않았기에 ZF 집합론 같은것도 캐무시하고 있었지만, 결국 오늘날엔 통합되어 ZFC 집합론 위에서 측도론을 배우게 된다.

확률론에서는 측도론과 적분론적 논의가 많이 진행되므로, 일단 실해석에서 이 두가지를 공부한 후 배우는것이 일반적이다.(물론, 확률론에서도 배우긴 하나, 어디까지나 확률론의 관심은 측도론이 아니라 확률론이며, 확률론 자체에서도 배워야 할게 많은 관계로, 초반부에 간단히 훑고 나서 진도를 빠르게 빼는 경우가 많기때문에 그때 즉시 접해서 쫓아가기는 힘들다.)

확률론 과목에서는 실해석학적인 확률분포와 확률변수의 해석, 확률적 수렴, 대수의 법칙 (Law of Large Numbers) 과 중심극한정리 (Central Limit Theorem) 의 실해석학적 증명, characteristic function (확률분포함수의 푸리에변환) 을 다루게 된다.

하다보면 확률공간에 대한 set놀음으로 많이 귀결되며, 이는 실해석학에서 limsup / liminf의 개념이 잘 잡혀있다면 처음을 익숙하게 시작할 수 있을 것이다.(물론 극초반으로 한정) 또한 확률을 finite measure, 확률변수가 measurable function인 걸 알게 되면 완전 적분론과 다를게 없어진다. 바로 Independence(독립성)가 나오기 전까지는... [4][5]

해서, 확률론 과목을 듣고 싶은 사람들은 이 과목이 기본적으로 통계학과는 조금 거리가 있다는 점을 염두에 두고 공부하는걸 추천한다. 그러나 통계 이론을 깊이 공부하고 연구하게 될 경우에는 확률론의 내용은 필요불가결하다. 예를 들어, 디자인한 통계 모형의 추정에 대하여 asymptotic property를 살펴봐야 하는 경우 대수의 법칙과 중심극한정리에 근거한 확률적 수렴으로 추정량의 성질을 설명하게 되는데, 확률론을 알지 못하면 내용의 전개가 쉽지 않을 것이다. [6]

이외에도 수형도 이론(Graph theory)에도 확률론은 많이 사용된다. 얼핏 보면 discrete structure 에 불과한 수형도에 확률을 사용하는게 이상하게 느껴지겠지만, 역시 20세기 천재 수학자중 한명인 Paul Erdoes 가 그래프를 확률을 이용하여 정의하고 이것을 통해 증명하는 기법을 선보이면서 새로운 하나의 분야가 열렸다고 볼 수 있다. 모든 증명에 적용되는것은 아니지만, 특정 증명의 경우, 수형도에 확률을 적용하면 기본적으로 Complexity 가 매우 낮아지기때문에 보다 간단한 증명이 가능해진다. 19세기 처음 등장하여 매년마다 오류가 포함된 증명이 발표되었다가 십수년전 컴퓨터의 도움을 받아 증명된것으로 유명한 4색정리의 증명만 해도 그래프를 분류하기 위한 룰만 600 개 가까이 되고, 이것으로 분류한 그래프만 1500 가지가 넘는걸 보면 Complexity 를 낮추는것이 얼마나 도움이 되는지 알 수 있을것이다.

----
  • [1] 경우에 따라선 측도이론을 확률론 책을 사용하여 공부하는 경우도 있다. 예를 들어 Billingsley 책이라든가...
  • [2] Andrey Kolmogorov (1903 ~ 1987). 러시아의 수학자로 확률론의 해석학적 구조를 확립한 사람이시다.
  • [3] 통계학이라는 학문이 꽤 근대에 와서 정립된 학문이긴 하나, 그 중에서도 확률론은 역사가 더더욱 짧다. (콜모고로프의 생몰년만 봐도 알 수 있듯이 틀이 잡힌지 채 100년도 되지 않은 분야이다.) 하긴 측도론 역시 정립된건 20세기 초였으며, 당시에는 박사과정에서 그쪽으로 분야를 정해서 가야 접해보는게 가능했다...
  • [4] 확률론과 해석학을 구분짓는 가장 중요한 요소가 바로 이 Independence이다. 다른 요소는 모두 실해석학에서 배운 것으로 다 환원할 수 있다. 밑줄 그어진 부분은 대학원 확률론 입문 까지의 이야기이다. 확률과 해석학을 가르는 기준은 Independence로도 볼 수 있겠지만, 그보다 정확하게 말하자면, path의 유무이다. 특히 stochastic과 관련된 부분에서는 path를 굉장히 중요하게 다룬다. 확률론을 공부하면 공부할 수록 Independence 를 가지지 않는 부분들이 나온다.
  • [5] 여기서 제시된 stochastic process는 확률변수에 시간축이 첨가된 것으로, 확률변수가 시간에 따라 값을 다르게 가지는 형태로 이해할 수 있다. (단순한 예로, 확률변수의 수열 같은 것을 생각해볼 수 있겠다.) 단순히 확률변수만을 관심사항으로 삼는 개론 범위에서보다는 한발짝 더 나아간 것이므로 일반적으로 확률론 외의 다른 과목에서 이 범주를 집중적으로 다루게된다.
  • [6] 이 정도 레벨은 비록 수리통계나 계량경제 계열의 박사과정에서나 나옴직하다. 쫄 필요 없다.