이번 대한산업공학회 추계학술대회는 한양대학교에서 진행되었다. 국내 산업공학 다양한 분야에서 어떤 연구가 진행되고 있는지 확인할 수 있는 기회가 되었다.

 

발표후기

Deep Unsupervised Anomaly Detection Methods for Multi-Channel Signal Data: A Comparative Study

 

다양한 분야에서 unsupervised anomaly detection은 상당히 유용하게 사용될 수 있다. 특히 최근 센서 및 데이터 수집/저장 기술이 발달함에 따라 다채널 센서데이터 분석에 대한 수요가 늘고있는데, 이를 분석하기 위한 전문 인력은 모자란 상황이다. 이러한 상황에서 센서들이 모니터링하는 시스템의 비정상 작동을 탐지할 수 있는 unsupervised anomaly detection은 유용하게 사용될 수 있다.

본 연구에서는 다채널 센서데이터를 분석하는 데 효과적이라고 알려진 convolutional neural network 기반 unsupervised anomaly detection 방법론들을 리뷰하고, 다양한 센서 데이터에 적용하여 성능 및 특징을 비교하였다. 본 연구에서는 이미지에서 성공적으로 anomaly detection을 수행한다고 알려진 convolutional autoencoder (CAE), variational autoencoder (VAE), AnoGAN, Deep SVDD 방법론에 대해 리뷰/실험하였다. 전반적으로 deep model들이 shallow model (PCA, KDE, isolation forest, OCSVM 등) 보다 좋은 성능을 나타냈으며, 위 모델들이 이미지에서와 같이 다채널 센서데이터의 unsupervised anomaly detection에도 적합하다는 것을 확인하였다

 

Q1. 설명에 따르면 anomaly detection 상황에서는 target (label)을 모르는데, 실험에서는 target (label)이 정의된 것 같다.

A1. Unsupervised anomaly detection 방법론들은 training 단계에서 target 값을 사용하지 않으며, task가 얼마나 잘 수행되었는지 확인하기 위해 testing 단계에서만 target 값을 사용하였다.

 

Q2. 일반적으로 anomaly라고 부르는 패턴은 특정 패턴으로 정의할 수 없다고 생각하는데, convolutional neural network가 이미지/시그널의 local invariant 패턴, spatial correlation 패턴을 반영하기 때문에 효과적이라고 설명하였는데, 이에 대해 자세한 설명이 필요할 것 같다.

A2. Anomaly detection은 training data와 다른 패턴을 갖는 관측치를 찾는 방법론으로 anomaly의 패턴을 학습하거나 할 필요는 없다. 단지 CNN이 training data의 패턴을 잘 학습하고, testing 단계에서 이와 유사한지 아닌지를 판단하는데 효과적인 것이다.

 

Q3. Multi-channel signal data에서는 전처리가 중요할 것 같은데, 실험에서는 전처리를 어떻게 수행하였는지, 전처리 하는 방식에 따라 영향을 많이 받는지 궁금하다.

A3. 첫 번째 실험은 채널 별 minmax scaling을, 두 번째 실험은 채널별로 standardization을 수행하였으며, 첫 번째 실험은 정상/이상간 패턴 차이가 뚜렷하여 전처리의 영향을 크게 받지 않은 반면 두 번째 실험의 경우 전처리하는 방식에 따라 성능 차이가 크게 나타났다. 전처리하는 방식에 따라 영향을 많이 받는 경우들이 있다.

 

청취후기

Structural MRI 이용한 청소년기 주요 우울 장애 분류 모델

MRI 이미지를 통해 소아 우울증 장애를 분류하는 binary classification 문제를 푼 연구이다. 최근 MRI 이미지에 대해 CNN을 적용하여 문제를 해결하려는 경우가 많다고 알고있었는데, CNN이 아닌 간단한 머신러닝 알고리즘을 통해 분류문제를 해결하였다.

MRI 이미지는 있는 그대로 분석하기 어렵기 때문에 feature extraction이 필요한데, freesurfer라는 MRI 이미지 분석 툴을 이용하여 사전에 중요하다고 정의된 다양한 feature들을 추출하고, 이를 간단한 머신러닝 알고리즘의 input으로 사용하였다. 간단하고 해석가능한 알고리즘을 사용하여 분류를 수행하였기 때문에 MRI의 어떤 특징이 소아 우울 장애 환자와 일반인을 분류하는데 중요한지 추가적인 정보를 제공할 수 있었다. 최근 neural network 모델이 유행하고 있지만, 여전히 기존 알고리즘들이 의미있다는 것을 확인할 수 있는 사례라고 생각한다.

 

Concept drift learning for nonstationary traffic control in automated vehicle systems

기존 연구실 세미나에서도 접한 적 있는 주제로, training data와 testing data의 확률 분포가 다른 상황에 대해 어떻게 대처할 것인가에 대한 내용이라고 볼 수 있다. 거의 대부분의 기계학습/통계 예측모델들은 training data와 testing data가 같은 확률 분포를 갖고 있을 것이라고 가정하고 있으며, 이는 매우 당연한 가정이라고 할 수 있다. 하지만 현실에서는 다양한 요인에 의해 training 시점까지 수집한 데이터와 그 이후의 데이터의 특성이 다를 수 있다. concept drift는 이런 변화가 구조적으로 일어날 경우를 가정하고 해결하려는 연구라고 생각한다. 개인적으로는 데이터 분포가 dynamic한 상황이 재밌다고 생각하지 않으나, 현실적으로 중요한 문제인 것 같다.