- 2018년 11월 13일 오후 11:09
- 조회수: 925
안건이
[발표 후기]
다중 센서 데이터 분석을 위한 설명가능한 합성곱신경망 모델
최근 센서의 발달로 인해 다양한 곳에서 데이터의 수집이 가능해졌다. 이러한 여러 개의 센서는 사람, 차량, 장비 등에 부착되어 시그널 데이터를 생성하는데, 이 데이터는 물체의 상태를 인지하는 연구에 사용된다. 이번 발표에서는 건설 장비에 센서를 부착하여 데이터를 수집하고 그 데이터를 바탕으로 건설 장비가 현재 어떤 작업을 하고 있는지 분류하는 문제를 발표하였다. 현실에서는 이러한 분류 문제도 중요하지만 더욱 중요한 문제는 센서를 어디에 몇 개를 부착해야 하는지가 매우 중요하다. 따라서, 최근 다중 센서 데이터 분석에서 높은 정확도를 보장하는 딥러닝 모델 중 하나인 Convolutional Neural Networks를 사용하여 특정 구간의 시그널 데이터를 하나의 이미지로 보았고, 단순 Convolutional Neural Networks가 아닌 구조를 변형한 Convolutional Neural Networks를 제안하여 중요한 센서(중요한 Channel)을 탐지하는 모델을 제안하였다.
Q1. 특정구간을 하나의 이미지로 봤다고 말했는데, 어떻게 이미지로 볼 수 있는가?
A1. 이해를 돕기 위해 이미지라고 설명 드렸지만, 실제로는 window size 만큼의 vector가 인풋으로 들어간다.
Q2. 각각 센서 마다 독립적으로 모델에 들어가는 것은 기존 앙상블 기법과 동일하지 않는가?
A2. 앙상블은 여러 개의 모델을 학습할 때 각각의 모델 마다 데이터, 변수를 랜덤하게 뽑아 학습을 한다. 또한, 각각의 모델이 결과까지 독립적으로 산출하고 마지막에 보팅을 통하여 최종 결과를 산출한다. 하지만, 제안하는 모델은 앙상블과는 거리가 멀다. 제안하는 모델은 데이터 인풋에 있어 랜덤성이 없으며(데이터와 센서), 파라미터 업데이트가 이루어질 때, 한번의 Loss로 모든 센서 인풋 데이터의 파라미터가 업데이트 된다.
[청취 후기]
1. 대량 정보 분석을 위한 저자명 노이즈 유형 분석
중소기업을 대상으로 컨설팅을 진행하는 한국과학기술정보연구원에서는 특허에 대해 저자명, 발명자명, 출연원인명 등에 대한 명칭 표기의 오기 및 이기 유형을 분석하였다. 중소기업에게 어떤 특허에 대해 설명해주고 컨설팅을 해주기 위해서는 기존에 출현이 되었던 특허에 대해 자세히 알아보고 중소기업에서 출현한 특허가 기존의 특허보다 어떤 강점이 있는지 컨설팅 하는 것이 매우 중요하다. 따라서, 기존 특허 정보가 매우 중요하다. 한국과학기술정보연구원에서 제시한 텍스트 분석은 다소 의문을 갖게 하였다. 단어 유사도를 계산할 때 단순 알파벳이 몇 개 같은지를 보고 단어 유사도를 계산하였다. 하지만, 이러한 단순한 방법으로는 한계가 분명히 있어보인다. 기존에 Word2Vec, fastText, Glove 등 다양한 word embedding 기법들을 사용하여 embedding 한 후 유사도를 계산하면 더 좋은 결과가 있을 것이라고 생각한다.