- 2017년 11월 7일 오후 10:11
- 조회수: 1788
강현구
<발표후기>
이번 대한산업공학회에서는 'A Classification Method for Multichannel Sensor data with Convolutional Neural Networks'라는 제목으로 현재 진행 중인 연구에 대해 발표하였다. 시계열로 표현되는 센서 데이터는 일반적으로 사전에 정의된 크기의 윈도우를 기본 단위로 하여 분류 문제로 풀어낼 수 있다.
멀티채널 센서 데이터, 혹은 다변량 시계열 데이터는 말 그대로 여러 시계열이 동시에 발생하기 때문에 시간에 따른 관측값들의 맥락은 물론이거니와 채널 간의 관계도 함께 고려해야 한다. 본 발표에서는 이와 같은 데이터의 특성을 잘 반영할 수 있는 convolutional neural network을 기반으로 하는 시계열 윈도우 분류 방법론을 소개하였다. 우선 이미지 데이터와 시계열 데이터가 갖는 공통적인 특성들을 설명하며, convolutional neural network가 이미지 뿐만 아니라 멀티채널 센서 데이터에도 사용하기 적합함을 예시를 들어 설명하였다. 이후 실제 차량에서 다양한 시나리오로부터 수집된 데이터를 사용하여 본 방법론이 우수한 성능을 보임을 보였다. 생각보다 많은 청취자들이 경청해주어 준비한 보람을 느꼈고, 향후 계획하고 있는 연구에도 어서 박차를 가해야겠다는 생각이 들었다.
질문1) 윈도우 사이즈는 어떻게 정의하는가?
답변: 윈도우 단위의 데이터 분석에 항상 꼬리표처럼 따라다니는 질문이다. 본 발표에서 사용한 데이터의 경우, 데이터를 제공한 사측에서 제시해주었다. 내가 알고 있는 바로는 윈도우 사이즈를 결정하는 연구는 없다. Convolution operation이 인풋의 크기에 대한 제약이 적다는 점에서 고민해 볼만한 연구주제인 것 같다.
질문 2) 왜 다른 머신러닝 알고리즘과 성능 평가를 진행하지 않았는가?
답변: 본 발표에서 convolutional neural network를 사용한 멀티채널 센서 데이터의 분류는 99.9%이다. 랜덤 포레스트와 로지스틱 회귀분석에 대해 실험을 진행하였지만, 발표 슬라이드에 포함하지 않았다. 그 정확도가 무작위로 찍는 것과 유사한 것은 물론이고, 본 데이터를 처리하고 모델의 인풋으로 만드는 과정 자체가 convolutional neural network에 너무 유리하기 때문에 굳이 소개할 필요가 없다고 판단하였다.
<청취후기>
대한산업공학회에도 갈수록 딥러닝 관련 연구가 많아지는 것 같다. 우수한 성능과 많은 가능성을 보여주기에 당연한 현상이지만, 기존과 같은 연구의 다양성은 점점 찾아보기 힘든 점은 매우 아쉽다. 머신러닝을 연구하는 사람으로서 공부를 하지 않을 순 없지만, 주관 없이 유행에 휩쓸려 방향성 없는 연구를 하지 않도록 주의해야겠다. 다음 학술대회에서는 데이터마이닝 및 머신러닝 관련 세션 이외에도 최적화 세션에도 관심을 두고자 한다.