- 2018년 12월 9일 오후 6:37
- 조회수: 1021
안건이
11월 30일 서울대학교에서
열리는 한국데이터마이닝학회에 참가하였다. 날씨는 굉장히 추웠지만 발표자들의 열정만큼은 뜨거웠다. 학회에서 졸업하신 선배님들과 기업에서 오신 분들을 만나고 현재 데이터 분석의 방향을 이야기하면서 뜻 깊은 시간을
보낼 수 있었다.
[발표후기] 합성곱신경망을
이용한 건설 장비 건강도 탐지
BI학회에서 “합성곱신경망을
이용한 건설 장비 건강도 탐지”라는 주제로 발표를 하였다. 건설
장비는 다른 산업에 비해 굉장히 값비싸기 때문에 한번 고장이 나게 되면 대체가 불가능하여 생산성에 큰 영향을 미치게 된다. 따라서, 건설 장비의 효율적인 관리가 필요한데, 효율적인 관리를 하기 위해서는 실시간 작업 인지가 필수적이다. 기존
연구에서는 센서(가속도계)를 건설 장비에 부착하여 현재 어떤
작업을 수행하고 있는지 분류를 하는 문제를 다루었다. 하지만, 현실에서는
위에 말한 문제도 중요하지만 어떤 센서가 어떤 작업에 얼마만큼 중요한 역할을 하는지 판단하는 것도 매우 중요하다.
따라서, 이번 발표에서는 구조 변형을 통한 CNN을
제안하여 높은 정확도뿐만 아니라 주요 센서 탐지를 가능하게 하였다. 이로 인해 불필요한 센서를 찾아내고, 센서 부착을 방지하여 건설 장비 분석 비용을 최소화하였다. 제안
모델의 우수성은 시뮬레이션 데이터가 아닌 실제 데이터를 수집하여 모델의 효과를 입증하였다. 추후에는
모델의 하이퍼파라미터를 여러 개로 설정하여 반복 실험을 하고자 한다.
Q1. 만약, 부품의 교체가
일어나고 재 실험을 하였을 때, 센서 중요도는 변경되지 않았는가?
답변: 사실 건설 장비의 부품 교체 이후 다시 데이터를 수집하여 센서
중요도의 변동이 없는 것을 확인하는 것이 현명해 보이나, 그러한 데이터를 수집하는 것이 쉽지 않다. 다음에 위에서 말씀하신 데이터를 확보하게 되면, 부품 교체 즉, 내부 부품 변동이 있었을 때도 주요 센서가 변하지 않는지를 확인해 보고 싶다.
Q2. 데이터의 특정 구간을 정하여 CNN에 모델링 하였는데, 기존 Machine
Learning 기법을 사용해 보지는 않았는가?
답변: 기존 연구에서 데이터의 특정 구간을 정하여 요약 통계량(최소값, 최대값, 평균, 분산 등)으로 Feature
Extraction을 하였다. 그렇게 표현된 센서 데이터는 Random Forest, SVM, MLP 등을 활용하여 정확도를 산출하였는데,
작업 상태가 3~5개 인데도 불구하고 가장 높은 정확도가 80% 정도였다. 따라서, 현재
제안한 모델은 20개의 Class에서 93% 정확도를 보였기 때문에 따로 Machine Learning 기법을
사용하여 비교 실험하지 않았다. 하지만 추후에 기본적인 시그널 데이터 전처리와 Machine Learning 기법을 사용하여 비교 실험할 예정이다.
Q3. 현재 Window Size와
Sliding Size는 경험적으로 정한 것인가?
답변: Window Size와 Sliding
Size는 CNN을 활용한 Signal Data에
일반적으로 사용되는 Size를 사용하였다. 경험적으로 산출하지
않았다. 추후에 Window Size와 Sliding Size를 변경해 가며 실험을 진행해 보고싶다.