- 2015년 6월 28일 오전 11:58
- 조회수: 1983
이한규
허명회 교수님의 keynote를 시작으로 시작된 이번 R conference는 학술적인 내용이 주가 된다기 보다 현장에서 R을 사용해서 데이터를 분석하는 '데이터분석가'가 모이는 자리라고 생각한다. 학생을 포함 국내 다양한 기업의 데이터분석 파트에 있는 약 500명의 '데이터 분석가'가 모였으며 현업에서 데이터를 어떻게 이해하고 있고, 어떤식으로 활용하는지에 대해 서로 이야기를 하는 자리였다. 오전와 오후 세션중에서 인상깊었던 부분에 대해 적어보고자 한다.
아래 내용은 첫번째 keynote 였던 허명회 교수님께서 말씀하셨던 워딩을 요약하였다. 한번쯤은 생각해 볼만한 내용이라고 생각한다.
"다양한 기계학습의 기법이 있다. 그러나 이러한 대부분의 기계학습 기법은 다변량 데이터를 분석함에 있어서 설명이 쉽지 않다. 각각의 변수들이 예측을 수행함에 있어서 어떠한 역활을 하는지에 대한 설명이 부족한데, 그렇다면 설명 없는 예측이 과학인가?" 라는 매우 철학적인 질문을 던졌던 것으로 기억한다.
물론 "예측이 우선이다" 혹은 "예측도 중요하지만 설명이 중요하다" 아니면 "둘다 모르겠다" 등등 다양한 관점이 존재할 수 있다. 개인적으로는 예측도 중요하지만 설명도 중요하다 라는 명제에 조금 더 쏠린다. 데이터 분석가 혹은 연구자 입장에서는 모델이 blackbox 상태여도 성능이 우수하면 환영받지만 반대로 사용자 입장에서는 성능이 아무리 좋더라도 "그래서 어떤게 중요한거고, 결과를 정말 믿을 수 있는것인지?"에 대한 의문이 항상 따라다닐 것이다. 이러한 의문에서 벗어나도록 근거를 명쾌하게 제시해주는 것 또한 데이터분석가들이 하는/해야하는 일이라고 생각되는 keynote였다.
다음으로 SKT Data Science center - Data Insight 팀의 정도희 팀장이 발표한 '기업에서의 데이터 사이언스, 그 실제 현실과 비전' 이었다. 기업 관점에서 데이터분석에 관해 보여주었다고 생각한다. 간단히 정리하면 다음과 같다.
"분석의 중요성과 가치를 인식하고 실질적인 데이터 분석 역량을 키워야한다. 데이터 분석이라는 도구를 활용해서 기존 프로세스의 "혁신" 또는 "개선"을 통해 새로운 가치 창출을 할 수 있다. 이러한 혁신 혹은 개선을 위해서는 단순히 데이터 분석만으로는 안되며, 비지니스 이해를 바탕으로 생각,행동, 성과를 좋게하는 실질적 영향력을 제공해야 한다. 즉, 분석결과를 바탕으로한 "비지니스 인사이트"가 매우 중요하다."
지금의 위치는 학생이기 때문에 연구와 비지니스를 연결해서 생각하는 것이 옳다고는 할 수 없지만, 언제가는 필요한 부분이라고 생각한다. 다양한 산학프로젝트가 이러한 능력을 향상 시킬 수 있는 한가지 방법이라는 생각이 들었다. 일반적으로 산학과제는 분석을 하고 결과를 정리하는 과정에서 나타난 흥미로운 사실위주의 정리를 한다. 그러나 몇번의 산학과제를 통해 얻은 사실은 사용자들은 어떠한 참신한 방법 및 알고리즘을 사용했는지 보다는 결과 그리고 이를 어떤식으로 현업에서 활용할 수 있을지에 대한 고민이 주된 고민이라는 점이다. 따라서 최종 정리하는 과정에서 한번쯤은 데이터분석가의 입장이 아닌 사용자의 입장에서 생각을 하는 것이 필요하다고 느꼈다.
단 하루였지만, 그동안 데이터 분석을 학생의 관점에서 봤었다면, 이를 기업들에서는 어떤 관점으로 보는지 간접적으로 느껴볼 수 있는 기회였다고 생각하며, 유익한 시간이었다.