지난 6월 30일 금요일 양재 L 타워에서 열린 R user Conference에 다녀왔다.
R CRAN을 관리하는 관리자들과 R을 사용하는 각계 각층의 사람들이 모인 다채로운 학회 행사였다.

일정 관계상 R의 Core를 관리하는 CRAN 관계자들의 발표는 듣지 못했지만 R에서 제공되고 있는
다양한 패키지들에 대한 관리와 CORE의 성능 향상과 관련한 발표가 이루어졌다고 했다.

R은 SPLUS라는 사용 통계 프로그램을 좀 더 다양한 사람들이 사용할 수 있도록 Open Source 방식으로
재구성한 공용 패키지이다. 세계 사람들이 새로운 가치들을 창출해내기 위해 편하고 강력하게 사용할 수 있는
패키지가 무료로 제공되고 있는데, 참 멋진 일이라 생각된다. 이러한 활동이 직접적으로 지식들을 만들어 내지는 않지만
다양한 연구자, 산업 관계자들이 지식을 창출해 낼 수 있는 일종의 거대한 지식의 플랫폼을 만들어냈기 때문이다.
세계적으로 수 백만명의 사용자들이 R을 매일 매일 창출해내는 지식의 가치는 돈으로 헤아릴 수 없을 것이다. 참 멋진 일이다.
내가 하고 있는 연구들도 기회가 된다면 잘 정리해서 공개하고 많은 사람들이 새로운 가치를 창출하는 데 이용될 수 있도록 노력해보고 싶다.

오후에는 정부 기관, 산업 현장, 연구 기관 등에서 R을 사용하고 있는 사용자들의 생생한 이용담을 들을 수 있었다.
나는 주로 Business Intelligence 관련한 R의 응용 사례와 Bioinformatics에 적용한 사례 발표에 참석했다.
Business Intelligence 쪽에서는 Open source R을 사용해서 저작권 문제 없이 신뢰성 있는 결과를 만들어 낼 수
있다는 주제들로 많은 발표가 이뤄졌다. 단, 분석 속도의 문제가 있는데 BLAS, LAPACK이나 Intel MKL을 적절히 사용하면
성능 문제는 해결할 수 있다고 한다.

Business Intelligence 쪽에서 가장 인상 깊었던 발표는 호주의 입국심사국에서 R을 사용해 이상 입국자, 예를 들어 마약 소지자,
밀수업자 등을 구분해내고 있다는 발표였다. 이러한 사람들의 패턴은 매우 희귀하기 때문에 이상과 정상의 비율이 1:1000 이상이 되어
분석이 어려운데 Boosting, Esemble 방법론들을 활용해서 해결하고 있다고 했다. 이러한 Imbalce 문제는 사실 품질, 헬스케어 등과 같은
다양한 분야에서 나타나고 우리 연구실에서도 활발하게 연구되고 있는 것이라 관심이 갔다.

데이터 마이닝 문제들이 다양한 분야에서 발생하고 있는데, 자세히 살표보게 되면 문제의 본질들은 사실 거의 대동소이한 것 같다.
데이터 마이닝 알고리즘, 이론에 대한 깊이 있는 공부와 함께 시야를 넓혀 다양한 분야에서 어떤 문제들이 있는지 살펴본다면
재미있고 의미있는 현실 문제들에 대한 해결책을 데이터 마이닝을 통해 제시할 수 있겠다라는 생각이 들었다.

Bioinformatics 쪽에서는 Topological Data Analysis라 해서 데이터의 Topological한 특성을 활용해 군집을 분류하는 연구에 대한 발표가
가장 인상깊었다. 사실 이 분야는 내가 하고 있는 말라리아 모기 연구와도 관계가 깊어 더욱 관심이 갔다.
데이터의 Feature들을 활용해서 관측치 간의 거리를 규정하는 Matrix를 생성하고, 이를 네트워크로 시각화해서 분석하는 방법이다. 발표자는 비만 환자의 군집을 구분해내고 구분된 군집의 의미를 규정하는 연구를 하고 있었는데, 분석의 자의성 문제만 해결된다면 좋은 연구가 될 것 같다.

관련 Reference로 제시된 것 중에서 유방암 환자 분석, 농구 선수들 성향 분석에 관련한 연구가 있었는데 각각 PNAS와 Nature 자매지에 실릴 정도로 영향력 있는 연구였다. 모기 분석 연구에 적용될 수 있는지 한 번 살펴봐야 겠다는 생각이 들었다.

이번 R Conference는 짧은 일정이었지만 많은 것들을 배우고 생각해볼 수 있는 기회가 되었다.
새로운 방법론과 시각에 대해서 배울 수 있었고 데이터 마이닝 전반이나 현실 문제들에 대해서도 넓게 생각해 볼 수 있었다. 다음에도 기회가 된다면 연구실 연구원들에게 추천해서 함께 참석해보면 좋을 것 같다.