- 2016년 11월 21일 오후 4:04
- 조회수: 1972
곽민구
이번에 고려대학교에서 열린 대한산업공학회 추계학술대회에 참석하였다. 개인적으로는 첫 번째로 학회에 참석하는 자리이고 연구를 처음으로 발표하는 학회였기 때문에 의미가 더 깊었다고 생각한다. 이른 아침부터 다양한 세션이 진행되었는데, 특이한 점은 데이터마이닝과 관련된 세션이 다른 분야에 비해 상당히 많았다는 점이었다. 최근 인기가 많아지고 있는 분야인 만큼 데이터마이닝 분야에서 다양하고 깊은 연구가 이루어지고 있다는 것을 느낄 수 있었다. 또한 산업과의 연계라는 측면에서 스마트공장, 산업융합 활성화 등의 다양한 주제로 특별 세션과 공모전이 열리는 것을 확인할 수 있었다. 이러한 주제들을 통해서 현실에서 발생하는 문제와 사람들의 니즈를 간접적으로나마 파악할 수 있는 기회였으며, 스스로도 연구의 방향과 기여점에 대해서 생각하고 고민할 수 있게 되는 자리였다.
발표후기
이번 학회에서는 데이터마이닝 세션에서 "Data-Driven Forecasting Method for Intermittent Demand"라는 주제로 발표를 하였다. 첫 번째 세션이었음에도 불구하고 많은 사람들이 참석하였다. 발표한 연구는 현실에서 자주 발생하는 간헐적 수요를 효과적으로 예측하는 방법에 관한 것이었다. 자동차, 건설장비, 항공기 등 많은 장비들의 예비 부품은 창고에 쌓아놓고 사용을 하는 경우가 많기 때문에 매주 혹은 매월 수요가 발생하지 않고, 불규칙하게 가끔 발생한다. 특수한 경우로 장비가 급작스럽게 고장이 날 때도 예비부품의 수요가 발생한다. 간헐적 수요 데이터는 일반적인 시계열 데이터와는 다르게 0이 많은 특징을 가지고 있어 예측을 하기가 매우 어렵다고 알려져 있다. 덧붙여, 예측력이 좋다고 알려진 Machine Learning 알고리즘을 적용한 사례가 적다. <br> 이를 해결하기 위한 시계열 방법론인 Croston's Method에 대해 간략하게 소개를 하고, 본 연구의 기본 아이디어를 얻게 된 인공신경망 기반 간헐적 수요예측 알고리즘에 대하여 설명을 하였다. 또한, 간헐적 수요의 지역적 패턴을 효과적으로 나타내기 위해 새롭게 생성한 변수와 이를 효과적으로 반영할 수 있는 알고리즘을 중점적으로 설명을 하며 발표를 진행했다. 제안한 알고리즘에서는 타겟변수로부터 설명변수를 파생하여야 하는데, 타겟변수를 모르는 미래 시점으로부터 테스트 데이터의 설명변수를 구성한 방법에 대하여 질문이 들어왔다. 실질적으로 모델을 사용할 때, 가장 고려가 되어야 하는 부분이라고 생각되었으며, 깊이 고민하여 추후 연구에 반영해야 할 요소라고 생각된다.
청취후기
데이터마이닝 연구에 대해 다양한 발표가 있었다. 텍스트마이닝 연구 중 영화 리뷰 데이터를 사용해 '도메인 기반 감성사전을 구축'한 연구가 흥미로웠다. 텍스트마이닝에서 감성분석은 전통적이면서도 매우 중요한 연구주제이다. 영어 감성사전은 많은 연구를 통해 구축이 되어있는 반면, 한글 감성사전은 그 수가 적으며 이 때문에 감성분석 연구에 현실적으로 어려움이 존재한다. 리뷰데이터를 Word2Vec을 통해 저차원으로 임베딩을 시키고, 거리기반 네트워크를 구축해 semi-supervised learning을 통해 감성점수를 추정하는 단계로 감성사전을 구축하는 내용이었다. 자명한 단어들에 대해 레이블을 먼저 붙이고 semi-supervised learning을 통해 역으로 점수를 붙이는 방법론이 인상적이었다. 또한, 상당히 많은 리뷰데이터를 활용하였는데, 아직 활용하지 않은 데이터가 있다고 하니, 이를 효과적으로 활용한다면 더 좋은 연구결과가 있을 것이라고 생각된다.