2017년 12월 21일 자 경향신문 '미래오디세이: 2035년, 평균의 종말'은 스티글러 선생의 책자 1장의 내용을 골자로 일부 내용을 덧붙였다. 후반부 증거기반의학은 친절한 설명을 붙이지 못해 아쉽다. 지난 원고가 분량이 부족하다고 해서 이번 원고는 충분히 써보냈더니 케틀레 선생의 조직가로서의 족적에 대한 문장 일부가 편집됐다.


미래오디세이: 2035년, 평균의 종말

황승식(서울대교수·보건대학원)


통계학의 역사를 연구하는 시카고대 스티븐 스티글러 교수가 지난 해 발간한 「통계학을 떠받치는 일곱 기둥 이야기」는 현대 통계학의 학문적 근간을 자료 집계, 정보 측정, 가능도, 상호 비교, 회귀, 설계, 잔차라는 기둥으로 나누어 서술하고 있다. 첫째 기둥으로 제시하는 자료 집계는 19세기까지는 관측의 결합이라고도 부르던 평균의 계산이다. 초등학생도 계산할 수 있는 간단한 산술 평균이 현대 통계학을 세운 첫째 기둥이라는 지적은 획기적이다. 스티글러 교수는 평균을 계산하기 위해 여러 관측에서 실제 정보를 얻으려면 정보를 버려야 한다는 점에서 혁명적이라는 표현을 쓰기도 했다. 개별 측정값을 무시하고 평균과 같이 하나의 요약값으로 제시하는 방식이 등장한 역사는 얼마나 오래됐을까?


피타고라스학파는 이미 기원전 280년에 세 가지 평균, 즉 산술 평균, 기하 평균, 조화 평균의 존재를 증명했다. 서기 1000년 무렵 철학자 보에티우스가 피타고라스학파의 평균 세 가지를 포함해 평균의 개수를 열 개로 늘렸다. 이때까지 사람들은 평균을 철학적 의미, 선분의 비례, 음악의 음률을 다루었고 자료 요약 목적으로 쓰지는 않았다. 1500년대 초반 야콥 쾨벨이 쓴 측량서 세밀화에는 성인 남성의 발 길이인 피트를 측정하는 모습이 나온다. 사람마다 발 길이가 다르므로 시민 대표 열여섯 명을 모아 한 줄로 세워 16피트를 1로드로 결정했다. 로드를 정하고 열여섯 구획으로 똑같이 나눴으므로 이 구획이 성인 남성 발 길이 열여섯 개의 산술 평균이지만 책에 이 용어가 나오지는 않았다.


1635년 그레셤대 천문학과 헨리 겔리브랜드 교수는 티코 브라헤가 만든 표에 근거해 나침반으로 진북을 찾는 데 필요한 보정값인 자침 편차 계산값 열한 개를 얻었다. 자침 편차 자료를 정리한 결과 표에 최초로 산술 평균이라는 표현이 나온다. 실제로 겔리브랜드가 산술 평균이라고 제시한 값은 최댓값과 최솟값의 평균값이라 엄밀하게는 현대적 의미의 산술 평균과 다르지만 이미 쓰던 방법에 이름을 붙인 업적이 크다. 고대인도 산술 평균을 알았지만 겔리브랜드 이전까지 누구도 저작물에 계산법의 명칭을 기록하지는 않았다. 1660년 무렵 과학자 로버트 보일이 측정을 결합하는 방식의 문제점을 제기했지만, 1660년대 후반에 이르러 산술 평균은 여러 출판물에 등장하고 공식 인정을 받게 됐다.


18세기 들어 평균 개념은 학계에 빠르게 확산됐다. 1755년 토머스 심슨은 메이클스필드 백작에게 보낸 실험 결과를 설명하는 편지에서 평균의 유용성과 오차 곡선의 개념을 역설했다. 1777년 다니엘 베르누이는 다른 이에게 보낸 편지에서 평균 계산이 규범이 됐음을 토로하기도 했다. 1809년 카를 프리드리히 가우스는 자신의 이름을 딴 곡선으로도 유명한 정규 곡선을 유도하는데 평균이 가장 좋은 추정량이라는 가정을 이용했다. 1810년 마침내 피에르 시몽 라플라스는 표본의 평균이 인구집단의 평균을 따라 정규 분포한다는 중심 극한 정리를 창안해 현대 통계학의 중요한 개념을 다졌다.


1830년 네덜란드 왕국에서 독립한 신생 벨기에 왕국은 행정조직은 개편하고 국가 차원의 통계조사를 계획했다. 체계적인 조사 수행을 위해 내무장관 리츠는 자신의 친구 아돌프 케틀레에게 도움을 요청했다. 많은 수를 관찰하고 수집한 다음 특정한 법칙을 찾아내는데 탁월한 재능이 있던 수학자 케틀레는 엄청나게 열정적인 조직가이기도 했다. 1833년 영국을 방문해 통계지부 설치를 도왔고, 1841년 벨기에로 돌아와 통계중앙위원회를 결성했으며, 1853년 최초로 국제통계학회를 조직해 통계 관련 간행물의 통일된 방법과 용어를 개발하기 위한 국제 협조를 호소하기도 했다. 케틀레는 오늘날 비만 측정 지표인 체질량지수를 개발한 사람으로 유명하지만, ‘평균인’이라는 개념을 창안한 업적이 더욱 중요하다. 평균인은 어떤 집단에 속하는 사람들의 신체적 특성뿐만 아니라 자살 성향과 같은 특성까지도 평균을 냈을 때 그 평균값들로 이뤄진 가상의 존재를 말한다. 케틀레는 평균인이 사회의 가장 전형적인 존재로서 사회를 대표할 수 있다고 보았고, 평균인의 이상화가 사회에 대한 예술과 문학의 대표성을 더욱 강화하여 정치가들이 여론에 귀를 기울여 정치를 발전시키리라 믿었다.


케틀레의 평균인 개념은 이후로 많은 비판을 받았다. 1840년대 앙투안 오귀스탱 쿠르노는 평균인이 매우 기괴한 모습이라고 비판하며, 직삼각형을 모아 변마다 평균을 낸다면 삼각형이 모두 닮은꼴이지 않은 한 결과물은 직삼각형이 아니라고 비꼬았다. 1865년 클로드 베르나르는 의학과 생리학에 평균을 쓸 경우 반드시 오류가 생긴다며, 어떤 남성의 소변을 24시간 모두 모아 분석한 평균은 존재하지 않는 소변을 분석한 결과로, 허기질 때 나오는 소변과 소화시킬 때 나오는 소변이 다르다는 점을 간과했다고 비판했다. 케틀레는 이런 비난에 굴하지 않고 집단을 대표하는 전형을 평균인이 잡아내므로 집단의 표본을 비교 분석할 수 있다고 반박했다. 평균인 개념은 자연과학의 방법을 사화과학에 활용하는 이론적 구성이 되었다.


1980년대 후반 등장한 증거기반의학은 개별 환자의 치료 결과가 아니라 무작위 대조 임상시험을 거친 치료 결과를 최고 수준의 증거로 인정하자는 의학계의 운동이다. 주요 언론의 건강 지면을 도배하며 대중의 이목을 끄는 신약 효과 기사가 대부분 무작위 대조 임상시험 결과에 기대고 있다. 신약의 효과 검증은 모집한 대상자를 치료군과 대조군에 무작위 배정하고 치료약과 대조약을 투약한 후 두 군의 평균적인 치료 성과를 통계적으로 비교하는 과정을 거친다. 대상자마다 개별 특성이 모두 다르고 효과 크기도 모두 다르지만 평균 차이가 통계적으로 유의하지 않으면 신약의 효과를 인정받지 못하고 시장에 출시할 수도 없다. 개인별 맞춤형 진단과 치료로 대표되는 정밀의학의 시대에는 개인별 임상시험 수행 결과를 종합하는 이른바 다수 1인(N-of-1) 임상시험이 확산될 전망이다.


평균으로 대표되는 자료 집계는 본질에서 정보 버리기, 즉 조지프 슘페터가 주창한 ‘창조적 파괴’ 활동을 필연적으로 수반하게 된다. 평균을 계산하다보면 궁극적으로 추구하는 목표에 어긋나거나 심지어 훼손시키는 정보를 원칙에 따라 버려야 한다. 어떤 문제에서는 관련 정보를 하나도 잃지 않는 자료 요약인 충분 통계량 개념을 쓸 수 있지만 빅데이터 영역에서는 실현하기 어려운 경우가 많다. 하버드대 토드 로즈 교수는 2016년 발간한 「평균의 종말」이라는 책에서 “분석하고 나서 집계하기”를 제안하기도 했다. 지금의 자료 축적과 분석 방법의 발전 속도를 감안하면 겔리브랜드가 산술 평균이라는 용어를 제안한 지 400주년이 되는 2035년은 통계학 연표에 평균의 종말을 선언하는 연도로 기록될 지도 모르겠다.


참고문헌:

대니얼 R. 헤드릭 (2011), 정보화 혁명의 세계사, 너머북스.

스티븐 스티글러 (2017), 통계학을 떠받치는 일곱기둥 이야기, 프리렉.

조재근 (2017), 통계학, 빅데이터를 잡다, 한국문학사.

Simon Raper (2017 December), The shock of the mean, Significance.

Todd Rose (2016), The End of Average, HarperOne.



Posted by 사이버독 cyberdoc

댓글을 달아 주세요