1. 발표준비과정

1) 연구의 수행


발표를 위한 논문은 지난 봄부터 서울과학기술대학교 강필성 교수와 우리 연구실이 공동연구를 수행했던, 18대 국회의원들의 투표행태의 연구였다. 전체 법안과 각 의원들의 속성들에 따라 기초 분석과 함께 네트워크 분석을 통한 의미를 찾고자 하는 것이 기본 설정이었다. 연구를 위해서 먼저 찬반의 논란이 큰 법안의 기준(상위 5%, 10%, 20% 그리고 전체)을 설정하고, 의원간 투표유사도 및 정당 유사도의 측정을 통해 소속정당, 지역구/비례대표, 개별국회의원의 투표행태를 시각화하고 소셜 네트워크를 통한 분석을 수행했다.


2) 발표 자료의 준비

연구의 전체를 수행하는 개인연구와는 달리 공동연구를 수행하였으므로, 기존 연구에 대한 전체를 이해하고 이를 바탕으로 발표자료(슬라이드)를 준비하는 것이 당연하다. 하지만, 발표자료 제출기한 전에 미리 준비하지 못한 상태에서, 시간에 쫓겨 일단 발표자료를 만들고 추후에 전 과정에 대한 이해를 하기로 했다. 이후 이 과정이 발표에 대한 뼈아픈 실수가 된다는 점을 알게 된다. 또한 김성범 교수님께서 지적하신 것과 같이 핵심만을 잘 정리하는 것이 중요한데도, 보다 많은 연구 내용을 청중에게 전달하려는 욕심에 연구결과를 충분히 정리하지 못한 실수를 범하게 된다.


3) 발표의 연습

준비된 발표자료와 사전에 작성된 논문을 같이 살펴보며, 발표 연습을 했다. 역시 발표의 시간이 부족했다. 또한 보다 간결하고 쉬운 이해를 돕는 설명이 잘 되지 않았다. 슬라이드를 여러 차례 정리하고 논문을 수 차례 정독을 했지만, 발표 수일 전까지도 시간은 부족하고 연구과정에 대한 이해는 점점 자신이 없어지는 상황에 이르게 되었다. 이때 슬라이드를 더욱 간결하게 수정하고, 이해가 되질 않았던 부분은 연구 당사자에게 문의를 했어야 했다. 하지만, 홀로 잘 할 수 있을 것이라는 아집에 사로잡혀 홀로 발표 준비를 하게 된다. 이점은 매우 잘못된 점이었다고 생각 된다.


2. 발표의 아쉬운 점과 개선방향

발표의 도입부분은 그다지 나쁘지 않았던 것으로 판단된다. 샤를드골의 명언(‘정치는 정치인에게만 맡겨두기에는 너무 심각한 문제이다’)을 인용하는 것으로 발표는 시작되었고, 청중들은 국회의원에 대한 투표행태의 분석에 집중 하는 듯 했다. 하지만, 연구의 핵심인 ‘의정활동의 지표’에 대한 설명이 시작되면서 청중들의 집중력이 흐트러지는 것을 느꼈다. 당황한 나는 장황하고 중구난방인 설명으로 시간을 소비하고 있었다. 당연히 시간은 부족했고, 아마추어 같은 모습으로 연구의 성과를 한참 깎아 먹는 발표를 하게 된다. 발표자료의 무리한 준비와 연구에 대한 충분한 이해가 되지 않았음을 그 발표장에 있었던 모든 사람들은 간파했을 것이다. 기본적인 준비과정에 대한 수행을 충분히 하지 못했던 후회가 밀려들었다.


3. 발표 후 나온 질문 목록과 답변 평가

첫째
질문은 국회의원 투표행태에 대한 시각화의 방법인 MDS(Multidimensional Scaling) 의 결과의 두 축이 의미를 설명이었다. 나는 구체적인 MDS 의 설명 없이 ‘새로 생성된 두 축이다’ 라는 궁색한 답을 내 놓았다. 질문자의 얼굴에는 물음표가 가득했고, 또 한번 당황하게 된다. 질문에 대한 정답을 몰랐기 때문이다.

이 질문에 대한 답은 아래와 같았어야 한다.
MDS 는 여러 관측치들의 변수들을 이용하여 개체들 사이의 거리 또는 비 유사성을 측정하고, 이를 이용하여 개체들을 2차원 또는 3차원 공간상의 점들로 표현하는 통계적 시각화 방법이다. 즉, 개체들의 비 유사성을 이용하여 공간상에 표시함으로써 개체들간의 상대적인 위치를 표시하고, 이를 이용하여 유사간 개체들을 파악하며, 이들 개체들을 2차원 공간상에 점으로 표현하여 개체들 사이의 집단화를 시각적으로 표현하는 분석방법이다.

예를 들어, 국회의원 C1 ~ C5 의 법안의 투표일치도(유사도) 아래 [표1]와 같다고 가정하자.
(본 논문에서는 투표일치도를 F1-measure 를 통해 산출)

[표1]: 국회의원간 법안에 대한 투표의 일치도













































 


C1


C2


C3


C4


C5


C1


1


0.9


0.8


0.1


0.2


C2


0.9


1


0.9


0.3


0.4


C3


0.8


0.9


1


0.2


0.3


C4


0.1


0.3


0.2


1


0.9


C5


0.2


0.4


0.3


0.9


1


표1을 활용하여 각 의원(observation)간의 투표 유사도에 따른 거리(Euclidean)를 계산하면 [표2]와 같으며, 이를 MDS에 의하여 2차원 공간상에 표현하면 [그림1] 과 같다. 이를 통해 국회의원 C1 C2, C3과 C4, C5의 국회의원의 투표행태가 유사함을 확인할 수 있다.














































 


C1


C2


C3


C4


C5


C1


0


 


 


 


 


C2


0.3316625


0


 


 


 


C3


0.3162278


0.2236068


0


 


 


C4


1.6822604


1.5362291


1.5779734


0


 


C5


1.5556349


1.3892444


1.4422205


0.2236068


0


이와 같이 각 관측치간의 유사성이 주어졌을 때, 이를 이용하여 공간상에 표현하여 데이터 구조를 파악하고, 이를 이용하여 각 개체의 상대적인 위치에 대한 유사성을 파악하기 위한 방법이 MDS이다. 따라서 이때 각 축은 관측치간의 거리에 따라 생성되며, 그 의미는 2차원상에 투영된 각 관측치간의 상대적 거리의 척도로 사용된다.

또한 MDS 분석에서는 관측치들의 변수가 숫자(구간/비율)로 관측되는 경우(metric MDS)와 명목척도를 관측하는 경우(Non-metric MDS)로 구분할 수 있다. Metric MDS 의 경우는 유클리드 거리를 이용하여 관측치들 사이의 거리를 구한다. 반면 Non-metric MDS 의 경우는 관측도수의 수를 확인하여 거리를 구한다. 이와 같은 개체들 사이의 거리를 측정한 후에는 2차원 공간상에 개체들을 표현한 후, 관측치들 사이의 원래 거리와 2차원 공간상에 표현된 거리를 비교하여 두 값의 일치성을 측정하는 기준인 스트레스(stress)를 이용하여 적합도를 판정할 수 있다. 최종 스트레스의 크기가 5%이내이면 잘 표현되었다고 할 수 있고 20%이상인 경우에는 잘못 표현되었다고 할 수 있다.

둘째 질문은 참여연대의 데이터에 대한 문의였으며, 참여연대의 온라인 서비스를 위한 데이터베이스를 수령하였으며, 국회 홈페이지에서 법령정보의 검색을 통해 동일한 데이터의 다운로드를 할 수 있음을 답변하였다.