고려대학교 DMQA 연구실

2018 한국데이터마이닝학회 추계학술대회 - 곽민구

2018년 12월 6일 오후 5:49
조회수: 940

Reviewed by

곽민구

서울대학교에서 진행한 한국데이터마이닝학회 추계학술대회에 참가하여 연구 발표 및 여러 연구들을 청취하였다. BI 학회는 처음으로 참가하게 되었는데, 대한산업공학회와는 다르게
주제 자체가 데이터 분석에 초점이 많이 맞춰져 있고 세분화가 되어 있어 관심있는 주제를 찾아 듣기가 더 쉬웠다.
역시 딥러닝을 활용한 연구들이 주를 이루었으며, 여러 문제 상황에 알맞게 구조를 변형하여
제안하는 연구들이 많았다.

[발표 후기] Monitoring
and Diagnosis for Multi-Channel Sensor Data

이번 BI 학회에서는 다채널 센서 데이터의 이상탐지 및 진단을 위한
프레임워크를 제안하는 연구에 관하여 발표를 했다. 센서 데이터를 통해 수집한 데이터를 이용해서 실시간으로
이상 시그널을 정확하게 탐지하면서, 동시에 진단을 수행하여 이상의 원인을 찾아내는 것이 중요하다. 센서 데이터의 특징인 시간적 흐름을 반영하고, 여러 센서 사이에서
일어나는 관계를 분석하고, 원인을 해석하는 이상탐지 모델을 구축하기 위해 Convolutional Autoencoder와 Isolation Forest를
결합한 프레임워크를 제안하였다. Convolutional Autoencoder를 사용해서 다중 센서
데이터의 시간적 흐름과 관계를 반영하여 정상 센서 데이터의 패턴을 효과적으로 학습한 이후에, 센서별
재구축 오차를 하나의 이상치 점수로 변환하기 위해서 Isolation Forest를 적용했다. 실제 2가지 종류의 차량에서 수집한 데이터에 제안 프레임워크를 적용하여
성능을 평가하였다. 이상 센서 진단은 정상고 이상 데이터간 센서별 재구축 오차의 히트맵 비교를 통해
정성적으로 수행했으며, 이는 현재 계속 진행중인 연구 주제이다. 다양한
모델과 시나리오에 대해서 실험을 진행하지 못했던 점이 아쉬웠으며, 추후 보완할 계획이다.

질문: Convolutional Autoencoder를 사용한 이후에
Isolation Forest를 사용한 이유는?

답변: Convolutional Autoencoder의 기능은 정상
센서 데이터의 패턴을 학습해서, 이상 센서 데이터에 대해서는 높은 재구축 오차를 산출하고, 정상 센서 데이터에 대해서는 낮은 재구축 오차를 산출하는 기능을 한다. Convolution 연산을 통해 센서 간의 관계를 반영함과 동시에 input data인 time window 내에서의 시간적 패턴도 반영할
수 있다. 다만, 재구축 오차에 대한 전체 평균을 이상 점수로
사용할 경우에는, 소수의 센서에서 이상이 발생할 경우를 탐지하지 못하는 경우가 많다. 이러한 전체적인 패턴을 고려하여 이상 점수를 산출하기 위해 Isolation
Forest를 사용했다.

[청취 후기] 콘텐츠 피쳐
추출기와 자취 피쳐 추출기를 결합한 가짜 얼굴 탐지 모델

서울대학교 김은지 연구원이 발표를 했으며, 최근 이슈가 되고 있는
Deepfake, Face2Face 등의 알고리즘을 사용해 생성된 가짜 이미지를 판별하는 주제에 관한
발표였다. 일반적으로 이미지에 CNN을 적용하는 이유는 이미지에
내재되어 있는 콘텐츠 정보를 추출하기 위함이다. 하지만, Deepfake,
Face2Face에 적용되는 알고리즘을 살펴보면 이미지의 콘텐츠를 바꾸기도 하지만, 특정
부분에 대해서 조건을 강제하여 바꾸는 기법들이 적용된다. 이러한 특징을 찾아내서 가짜 이미지를 판별하기
위해 자취 피쳐를 추출할 수 있는 모델을 적용했다. 다양한 모델을 적용해서 제안 기법의 성능을 입증했으며, Class Activation Map을 통해 제안 모델의 각 파트가 이미지의 어떤 부분을 보고 가짜 이미지를
판별하는지 시각화까지 해서 더욱 인상 깊은 발표였다고 생각이 든다.

Conference