- 2014년 11월 19일 오후 2:08
- 조회수: 2397
강지훈
2년만에 INFORMS 참가차 샌프란시스코로 가게 되었다. 10년 전쯤 들렸던 도시지만 실제로 도심에서 지내본 것은 처음이였다. 여타의 미국 도시와는 좀 다르게 60~70년대의 향기가 느껴지는 매력적인 도시였다. INFORMS는 올해가 4번째 참석이였는데 전체적으로 데이터 분석에 관한 연구의 흐름이 많이 변한 것을 확인할 수 가 있었다. 2년전에 피닉스에서 열린 학회에서는 주로 monitoring 방법론과 social network analysis가 큰 이슈였다면 이번 학회에서는 주로 optimization과 기존 data mining 분석 기법의 만남이 주된 이슈였고 수 많은 학자들이 해당 주제에 대해 연구결과를 발표하고 공유하는 것을 확인하였다. 기존 optimization에서는 현실 문제를 잘 반영하는 목적식 설정이 가장 어려운 이슈였는데 그 부분을 데이터 분석을 기반으로한 modeling을 통해 극복하여 다양한 분야에 자유롭게 활용될 수 있다는 강한 insight를 여러 발표들을 통해 얻게 되었다.
MIT 최적화 연구소의 Dimitris Vertimas 교수의 multicollinearity 문제를 mixed integer programming을 통해 해결하는 방법론 연구는
우리 연구실 김영훈군의 연구와 상당 부분 같은 맥락을 지니고 있었는데, 이것을 보면서 본인 뿐만 아니라 다른 최적화를 연구하는 연구자들도 본인들의 위치에 관계 없이 시대적으로 같은 문제를 공감하고 해결하고자 노력한다는 것을 알게 되었다. Texas A&M의 Simon이라는 교수의 발표 역시 인상 깊었는데그는 Penalized(혹은 regularized) regression 모델을 활용하여 다양한 데이터셋에 직접 적용해보고 어떤 방향으로 알고리즘을 활용할 수 있는지에 대해서 보여주었다. 이 세션을 들으면서 아무리 좋은 방법론을 알고 있어도 실제 문제의 특징과 의의를 잘 이해하고 적용해야 그 방법론이 빛을 발하는 것이라는 생각을 하게 되었다. 또 Simon 교수의 빅데이터에 대한 정의가 나름 명료하고 신선 했었는데, 그는 빅데이터는 바로 "n=all" 즉, 샘플=모수라고 청중들에게 설명하여 많은 학자들이 공감하였다. 예측에 대한 세션도 듣게 되었는데, 그곳에선 'Brier score"라는 새로운 prediction performance measure에 대해 접하게 되었다.일반적인 Y value를 직접 예측하는 것이 아니라 확률 예측(probabilistic prediction)에 대한 정확성을 판단하는 척도라는 점이 일반적으로 우리가 활용하는 MSE, MAE 같은 척도와는 달랐다. 아마 나를 제외한 모두가 prediction을 메인으로 하는 학자들인지라 이 척도에 대해 모두가 상식으로 알고 있었으며 이 부분은 개인적으로 학습을 피상적으로 해왔다는 반성을 하게되는 계기가 되기도 하였다 (실제로 1950년도에 제시된 척도이다, link : http://en.wikipedia.org/wiki/Brier_score). 우리 연구실에서 수 많은 프로젝트를 forecasting 쪽으로도 진행하고 있는데 이러한 척도를 잘 이해하고 응용한다면 좋은 결과를 낼수 있지 않을까도 생각해본다. 또 classification 모델의 performance 예측도 단순히 classification error가 아니라 이런 확률이 가중치로 들어간 방법을 활용하면 여러 부분 장점이 있을것으로 기대된다. 또 INFORMS 첫날 오전에 듣게된 Hui Yang 교수의 발표도 굉장히 신선했었다. 일반적으로 차원을 축소시켜 데이터를 분석하는 방법에 사람들은 초점을 맞춰왔는데 그 교수는 되려 적절하게 차원을 늘려 시각적으로 표현할 수 없었던 것들 (예를 들어 시계열 데이터를 3차원 상에 표현하고 그 변화 패턴에 대해 그래픽으로 시연)을 다양한 형태로 표현하고 분석에 응용한 것이 인상적이였다.
개인적으로도 data mining & analytics workshop 과 일반 INFORMS, 2번의 발표를 하게 되었다. 발표를 하면서도 깨달은 점이 완벽히 정리되지 않은 너무 많은 정보는 오히려 전달함에 있어 부정적인 요소로 작용한다는 것을 알게 되었다. 연구자의 입장에서는 모든 내용이 다 신선하고 재미있을 것이라 기대하지만 실제로 청자들은 많은 부분 관심이 없으며 이해도 되지 않기에 핵심적이며 가장 중요한 부분을 강조하고 이해시키는 발표를 연습하는것이 특히, 원어민이 아닌 외국인으로써 영어발표에서는 매우 중요하다고 느껴졌다. 개인적으로 가장 연습을 많이 해본 발표였지만 오히려 가장 긴장을 많이하고 아쉬움이 많이 남았던 발표였다. 학회에서는 다른 사람들의 좋은 연구내용을 이해하는 것도 중요하지만 정말 presentation 잘하는 사람을 눈 여겨 보고 따라하면서 연습해 보는 것도 큰 배움이 아닌가 생각이 들었다.
학회 마지막날에는 교수님의 추천으로 SK innovation O&A(optimization & analytics) lab의 Faramroze, 권기상 박사님과 interview를 보게 되었다. 입사여부를 떠나 굉장히 좋았던 경험이었다. 뉴질랜드의 교수출신인 Faramroze 박사는 optimization 쪽에서 매우 유명하고 능력있는 인물로써 일과 연구에 대한 열정이 뛰어나고 말을 상당히 논리적으로 잘하는 사람이였다. 예상한것보다 긴 시간 대화를 나누었는데 정말 시간가는줄 모르고 무언가를 수업을 통해 배운 느낌마저 들었다. 그런 사람과 interview를 보면서 느낀것은 내가 연구실 생활을 하며 고생했던 것들, 교수님과의 대화 중에 수없이 강조하셔서 귀에 인이 박힌 것들 등이 실제로 이런 위기상황(?)에서 나의 가치관 같은 형태로 발현된다는 것을 깨닫게 되었다. 항상 학위를 한 사람은 누구나 일과 연구의 경계를 걷게 되는데, 그 두 박사님들과의 대화를 통해, 내가 갖고 있던 일과 연구에 대한 추구가 어느 정도 해결해된 것 같았다. 그리고 나를 포함해 랩인원들이 나아가서 세상이 필요로 하는 분석가가 되기 위해서는 자기가 잘 아는 부분 이외에도 다양한 분야에 대해 관심을 기울이고 배우려는 태도를 잊지 않는 것이 중요하다는 생각이 들었다. 그리고 마지막으로 보다 global한 학자가 되기 위해서는 연구는 물론이고 영어 공부 역시 틈틈히 해나가는 것이 매우 중요하다는 것도 잊지 말아야 할 것이다.