고려대학교 DMQA 연구실

2017 대한산업공학회 추계학술대회 - 이민정

2017년 11월 6일 오후 8:26
조회수: 2336

Reviewed by

이민정

<발표후기>

이번 학회에서 발표한 연구주제는 '재구축 기반의 다중센서데이터 이상탐지 기법'이었다. 재구축 기반의 이상탐지 기법은 준지도 학습의 이상탐지 기법(one class classification, novelty detection)의 방법 중 하나이다. 따라서 불균형의 문제를 해결할 수 있으며 특히 재구축 기반의 이상탐지 기법은 고차원의 데이터에 유연한 특징이 있다. 따라서 주행 차량에서 수집된 고차원이며 불균형한 다중센서 데이터의 이상탐지에 적합하다. 재구축 기반의 이상탐지는 저차원으로 변형시킨 이후 재구축하는데 사용되는 방법론이 PCA, SAE, LSTM-AE, CAE 중 어떤 모델을 사용하느냐에 따라 종류가 나뉘게 된다. 이 네가지 방법을 비교실험 하였을 때 CAE(Convolutional Autoencoder)를 사용한 재구축 기반 이상탐지 기법이 다중센서의 데이터의 특징(시간의 흐름과 센서간의 관계를 동시에 살펴보아야 한다는 점)을 반영하기에 적합한 구조를 띄어 우수한 성능을 보였다.

발표 이후 네가지 질문을 받았다. 첫째, 결과로 나온 베타 값이 유의미한 값인가 묻는 질문이었다. 해당 데이터의 불균형 상황이 얼마나 심한지 보여주며 베타 값이 얼마나 좋은 결과인지 설명하였다. 앞으로 이런 의문은 향후 Threshold를 여러가지로 변경하여 모든 실험에서 베타 값이 유의미하게 좋은 값을 보이게 된다면 청중에게 신뢰를 주는 결과를 제시할 수 있지 않을까 생각해본다.
둘째, CAE 모델로 데이터를 입력 시킬 때 센서의 위치 배열을 어떻게 하였냐는 질문이었다. 이 질문을 한 사람은 기존의 CNN을 활용하여 지도학습 방법으로 이상탐지를 한 논문을 보았던 사람이었던거 같다. 기존의 논문에서는 센서들에서 나온 값을 위로 쌓았었기에 이미지의 높이처럼 되어 인접 센서의 위치가 중요하게 되었을지 모르겠지만 나는 RGB channel과 같이 뒤로 쌓았기에 나에게 해당되지 않은 문제 사항이었다.
셋째, 모델 학습시에 이상이 매우 작으니깐 정상과 섞어서 학습을 하여도 되지 않냐는 질문이었다. 이 질문은 내 모델이 준지도 학습의 이상탐지로써 모델의 학습에 정상의 데이터만 사용된다는 것에서 완전히 벗어난 질문이었다.
넷째, 윈도우 내 이상과 정상이 섞여 있을 것에대한 의문이었다. 정상의 윈도우내에는 이상은 전혀 존재하지 않고 이상의 윈도우에는 질문자의 말처럼 이상과 정상이 섞여 있다. 따라서 이상이라고 판단된 윈도우내에 어떤 부분이 이상인지 확인하는 과정이 향후에 진행된다면 좋을 것이라고 판단되었다.

발표를 하기전에 충분한 수분섭취가 필요할 것 같았다.다음에는 조금 더 차분하게 청중을 압도할 수 있는 발표를 할수있도록 연습할 것이고 질문에 대한 대답을 해당 슬라이드로 돌아가지 않고 말로 설명할 수 있는 능력도 기르는 것이 필요할 것 같다.

<청취후기>

1. [단어와 자소기반 합성곱 신경망을 이용한 문서 분류], 모경현, 박재선, 장명준, 강필성(고려대학교 산업경영공학과)
기존의 문서 분류는 의미를 갖는 최소단위인 단어를 기준으로 많이 이루어져있다. 본 연구에서는 자소단위로 단어를 분해하여서 사용하는 분류기와 단어를 사용하는 분류기를 병렬로 붙여서 사용하여 문서 분류를 진행하였다. 이와 같은 방법은 형태소 분석기의 성능에 따라서 분류의 성능이 달라지는 점을 보안할 수 있다고 하였다. 하지만 그 분류 성능의 차이가 굉장히 미비하였다는 점과 실험에 사용된 문서에서 긍정의 문서에서는 부정의 단어를 부정의 문서에서는 긍정의 단어를 제거하였다는 점이 논리적으로 설득력이 떨어지게 느껴졌다.

2.[Deep Q-network를 통한 미래 전장 무인전투기 임무 수행 알고리즘], 이경택, 김상진, 김창욱(연세대학교 산업공학과)
해당 연구는 Q-learning의 발전된 알고리즘인 Deep Q-network를 활용하여 무인항공기가 미사일 회피 및 최단거리로 임무를 수행하는 방법을 제안하였다. one-hot encoding 방식을 활용하여 실수좌표를 유한개로 표현하였고 인공신경망의 은닉층을 하나만으로 설정함으로써 모형을 단순화 시켰다. 그럼에도 불구하고 임무수행을 달성할 수 있게 하였다. 해당 연구는 딥러닝 기반 강화학습 방법 중 한개를 사용하여 연구한 주제였기에 강화학습에 무지한 나는 이해가 완벽히는 되지 않았다. 하지만 앞으로 딥러닝을 심도있게 공부하면서 강화학습을 병행해야겠다는 계획을 세울 수 있게 해준 발표였다.

3. [Multi-task ConvLSTM네트워크를 통한 풍력 터빈 예측], 우성철, 박진규(KAIST 산업 및 시스템 공학과)
Multi-task Convolutional LSTM 딥러닝을 모델을 사용하여 바람의 시공간적인 변화를 구조화하며 풍속에 따른 터빈의 에너지 생산량과 하중을 예측하는 모델이었다. 내 연구에서는 시간과 센서간의 관계를 Convolution연산으로 해결가능하다고 생각하였는대 이 연구에서 보여주듯 ConvLSTM을 사용하면 어떤 결과가 나올지 궁금하였다. 또한 요즘 데이터 내의 시공간적인 관계를 구조화하여 이를 해결할 수 있는 딥러닝 모델을 적용하는 것이 많이 이용된다고 생각된다.

4.[클래스 불균형 데이터 분류를 위한 군집화 기반 언더샘플링 기법], 오주혁, 백준걸(고려대학교 산업경영공학과)
본 연구는 k-medoids 알고리즘으로 다수 범주를 군집화 한 이후 소수 범주에 가까운 대푯값에 가중치를 주어 추출될 확률을 높여 복원 추출함으로써 다수의 균형 데이터를 생성한다. 그 이후 다수의 분류기를 학습시키고 앙상블 기법을 사용하였다. 이 발표가 인상 깊었던 이유는 발표 이후 이한규 선배님께서 연구의 핵심적 단점(n이 커지면 k-medoids 계산 시 시간이 오래걸릴 수 있다는 점)을 얘기하신 점 때문이었다. 나도 앞으로 발표나 논문을 읽으면서 그 연구의 핵심이 무엇이고 단점이 무엇인지 잘 짚을 수 있는 연구자가 되고 싶다.

Conference