경주에서 열린 2018 대한산업공학회 춘계학술대회에 참가하였다. 공동학술대회인만큼 발표된 연구들의 주제도 다양하였다. 작년에 비해
특별세션의 종류와 개수가 많아졌다는 생각이 들었으며, 반도체에 관한 발표가 많았던 점 또한 흥미로웠다. 하지만, 같은 시간에 발표가 진행되다 보니 원하는 발표를 전부 듣지
못했다는 아쉬움이 남는다.



 



 



[발표후기]



특별세션 '설비 및 장비 진단을 위한 다채널 시계열
센서 데이터 분석'에서 '장비 상태 모니터링을 위한 다채널
센서 기반 이상치 탐지'를 주제로 발표를 하였다. 센서와
장비의 발달로 장비 및 차량에 다양한 종류의 센서가 부착되고, 이러한 센서들에서 얻어진 시그널 데이터를
분석하여 장비의 주행 상태를 모니터링하고자 하는 시도가 최근에 많이 이루어지고 있으며, 이번에 발표한
주제 또한 이러한 연구들의 일환이다. 이번 발표에서 Convolutional
Autoencoder (CAE)
Isolation Forest(iForest)를 결합한
재구축 기반 이상 탐지 모델을 제안하였으며, 실제 건설장비에서 수집한 주행 상태별 시그널 데이터에 해당
모델을 적용하여 성능을 검증하였다. 제안한 모델의 프레임워크는 다음과 같다.



 



1) 하나의 운전 상태 (정상)에 대하여 Skip Connections를 이용한 CAE 모델을 구축한다. Skip Connectionsencoderdecoder를 대칭적으로 연결해주며, 이러한 기능한 image restoration에서 좋은 성능을 보이는
것으로 이미 검증되어 있다.



2) 센서별 Reconstruction Error를 구한다. 일반적인 재구축 기반 이상치 탐지 모델에서는 센서별로 계산한 Reconstruction
Error
의 평균값을 사용한다.



3) 평균을 구하는 과정에서 손실되는 정보를 반영하기 위해 iForest
적용한다. 이 모델은 데이터의 특정 비율이 이상치라고 가정을 하기 때문에, 평균값의 cutoff를 구하는 percentile
같다고 할 수 있다.



 



Skip Connections를 사용한 모델의 우수성을 검증하기 위해, 적은 레이어를 사용한 모델 및 많은 수의 레이어를 사용하였지만 Skip
Connections
를 사용하지 않은 두 개의 비교 모델을 추가적으로 구축하였다. 검증
데이터에 대한 재구축 오차를 통해 제안 모델의 우수성을 보였다. 또한,
단순 평균에 비해 iForest를 사용한 모델의 우수성은 정상 및 이상 데이터에 대한 Type 1, Type 2를 구하였다.



 



Question 1: Reconstruction ErrorIsolation
Forest
를 사용하는 것보다 bottleneck 부분에 사용하는 것이 더 좋을 것 같다.



Answer 1: 연구를 진행하면서 느꼈던 부분이라 향후 계획에서 언급하였다. Decoder
성능을 향상시키기 위해 skip connections를 적용하였지만,
encoder
의 성능만 충분히 좋다면 bottleneck에 이상치 탐지 모델을 바로 적용하는
것도 의미가 있을 것이라 생각된다.



 



Question 2: 다채널 분석을 하기 위해 CAE를 사용하였는데, 개별 센서별로 모델을 구축하는 것이 더 낫지 않을까?



Answer 2: 생각보다 컴퓨팅 파워가 크게 필요하지 않기 때문에 통합 모델을 구축하는 것이 더 의미가 있다고
생각되며, 개별 모델을 구축하게 되면 채널 사이의 관계를 반영할 수 없다는 단점이 있다.



 



 



[청취후기]



- 딥러닝 모델을 활용한 교통 혼잡도 예측 및 Geometric 딥러닝
모델의 활용 방안



딥러닝 모델을 기반으로 교통 혼잡도를 예측하는 방안에 대하여 진행된 발표였다. 딥러닝 모델을 사용하여 데이터 전처리, model architecture,
feature engineering
을 효과적으로 사용한 사례들에 대한 설명이었다. 교통
혼잡도를 예측하는 문제의 특성상 데이터의 시간적, 공간적 특성을 반영하여 모델을 구성하는 것이 필수적이다. Convolutional Neural NetworkLSTM
Recurrent Neural Network
를 사용하여 이러한 특성을 반영할 수 있는 모델을 구성하였다. 또한 도로의 관계 및 유사성을 표현하기 위해 유클리디안 거리가 부적합하다는 것을 언급하였으며 그래프 기반의
거리를 사용하여 도로의 관계를 효과적으로 표현한 사례를 소개하였다. 이와 같이 다양한 사례를 소개한
것은 좋았으나, 단순히 사례를 정리하는 것에 그쳤다는 점이 아쉬웠다.



 



- Recurrent Neural Network-based Semantic
Variational Autoencoder for Sequence to Sequence Learning



RNN-VAE 모델을 기반으로 입력 문장의 global latent
feature
를 효과적으로 학습할 수 있는 sequence to sequence 모델을
구축한 발표였다. Doc2Vec, Attention 등 기존의 연구에서 사용되는 다양한 텍스트마이닝
기법을 사용하였으며, 제안된 모델의 핵심은 Encoder 부분에서
bidirectional 형식으로 입력 문장을 학습하게 되는데, 이때
각 방향에 대해서 구한 attention을 평균으로 사용한다는 점이다.
이를 통해, 문장의 시작부분에 집중되어 있는 attention
값을 균등하게 사용할 수 있다. 직관적이면서도 간단한 아이디어로 좋은 결과를 낸 점이 인상적이었다.



 



- 머신러닝 및 텍스트 마이닝 기반의 VDS 고객 불만
분석 기법 개발

자동차 품질에 관한 설문 조사를 텍스트마이닝 기법으로 분석하여 고객 불만을 정량적으로 나타내는
연구였다
. 특이한 점은 특이, 민감 소비자의 의견을 탐지하고
분석했다는 것이다
. 텍스트 데이터의 전처리, 이상치 탐지
및 키워드 추출
, 키워드 및 관계도를 분석하는 순서로 진행되었으며 결과물을 그래프로 시각화하여 보여주었다. 현장 엔지니어들과의 긴밀한 협업을 통해 해석에 용이하고 유의미한 결과물을 얻어냈다는 점이 인상적이었다. 대부분의 소비자가 아닌 특이, 민감 소비자를 타겟으로 할 경우 도메인
지식이 없는 입장에서는 결과를 해석하고 평가하기가 상당히 힘들기 때문이다
. 다수의 평가를 분석할 경우
오히려 뻔한 결과가 나올 수 있다는 점에서 특이
, 민감 소비자를 대상으로 했다는 생각이 들었으며 주관식
문항 뿐만 아니라 객관식 문항도 종합적으로 분석하였을 때 얻을 수 있는 결과가 궁금했다
.