이번 한국BI데이터마이닝학회는 부산에서 개최되었다. 프로그램 위원장을 맡아 발표를 구성하면서 데이터마이닝 관련 다양한 분야를 아우르려고 노력을 했다.

 

1. 10개의 세션 명은 다음과 같다: Big Data in Healthcare, Data Quality, Deep Learning Applications, Ensemble, SAS 논문경진대회, Data Mining Applications, Manufacturing Analytics, Text Mining, Business Analytics, Machine Learning Applications. 

2. 프로그램위원장을 하면서 논문을 모집하다 보니 별 상황을 다 맞이한 것 같다. 어떤 연구실은 10개가 넘는 발표를 신청했다가 막판 다수의 발표를 취소해 버리는, 하지 말아야 할 행동을 하기도 했다. 우리 연구실 역시 다수의 발표를 하는 경우가 꽤 있는데 지도교수인 내가 관리를 잘 해야겠다는 생각이다. 또한, 특별한 이유 없이 발표 시간을 구체적으로 요청하는 사람들도 있었는데 좋아 보이지는 않았다 (날짜 정도는 요청할 수 있다고 생각한다.) 또한 세션 전에 본인의 발표 자료는 최소한 제대로 작동하는지 확인해야 하는데 그렇지 않고 있다가 귀중한 시간을 낭비한 경우도 있었다. 



3. 발표 주제는 최근 트렌드를 반영하듯 Deep Learning 알고리즘을 이용한 응용이 가장 많았다. 개인적으로는 굳이 이런 분야까지 Deep Learning을 이용해야 하는지 의문이 들기도 하였다. 연구를 위해 Deep Learning이 사용되어야지 Deep Learning을 이용하기 위하여 연구를 수행하는 것은 올바른 방향은 아닌 것 같다. 



4. 이번 학회에서 내가 들은 베스트 발표는 성균관대학교 강석호 교수님의 Model Validation in Class Imbalance Scenario 였다. 불균형 상황을 해결할 수 있는 알고리즘이 다수 발표되고 있는 상황에서 최소한 확보해야 하는 정확도를 시뮬레이션을 통해 알아낸 매우 근본적인 내용이었다. 이런 근본적이고 기본적인 연구가 많이 행해졌으면 하는 바람이다.