본 프로젝트는 다수의 센서로 구성된 차량 주행 데이터를 활용하여 차량의 노후화를 평가하기 위한 건전성 지표를 개발하는 것을 목표로 한다. 실제 레이블 및 잔여 수명 데이터가 부족한 상황에서 비지도 학습을 통해 건전성 지표를 도출하였으며, 시간에 따른 지속적인 노후화를 전제로 하는 기존 연구들과 달리 일부 부품의 교체로 인한 노후화 개선을 반영할 수 있는 동적 지표를 생성하여 차별화하였다.


1. 차량 주행 데이터 전처리

본 연구에 사용된 데이터는 하이브리드 차량의 225.2km부터 15,310km까지의 실제 주행 기록이다. 해당 데이터는 실제 주행 차량에서 수집되었기 때문에 수집된 날짜와 시간이 불규칙하며, 다수의 주행 거리 구간에 누락된 데이터가 존재한다. 차량은 다양한 부품으로 이루어진 복잡한 기계로, 1개의 시간 변수와 500개 이상의 센서 변수로 구성되어 있다. 이를 딥러닝 모델에 학습시키기 위해, 1) 선형 보간법을 사용해 결측치를 보완하고, 수집 간격을 0.01초로 통일하는 작업을 수행했으며, 2) 차량의 주요 기능을 담당하는 시스템을 크게 네 가지로 나누고, 관련 변수를 할당하는 '차량 시스템 군집화' 과정을 거쳤다. 3) 각 시스템의 가동 여부를 구분하는 변수를 통해 가동 구간을 선정하고, 슬라이딩 윈도우 기법을 적용해 각 가동 구간의 입력 데이터를 생성하였다.


2. 재구축 오차 기반 모델을 활용한 건전성 지표 구축 개발

건전성 지표는 기계 시스템의 모니터링 데이터를 바탕으로 현재 기계의 노후 상태를 정량화한 값을 의미한다. 최근 센서 개수의 증가로 데이터의 양이 기하급수적으로 늘어남에 따라, 중요한 특징을 자동으로 추출할 수 있는 딥러닝 기법을 사용하는 연구가 활발해지고 있다. 하지만, 지금까지 제안된 건전성 지표 구축 연구는 기계 시스템에 대해 가동 시작부터 끝까지의 생애 데이터 전부를 필요로 한다. 이로 인해 차량과 같이 생애 주기가 긴 기계에는 적용하기 어렵하는 한계점을 가진다. 본 프로젝트에서는 학습 데이터 분포와 다른 분포를 가지는 데이터가 들어왔을 때 재구축 오차가 커진다는 재구축 모델의 특징을 활용하여 차량의 초기 생애 데이터만으로도 건전성 지표를 구축할 수 있는 방법을 제안하였다. 특히 시계열 데이터에 특화된 LSTM-VAE를 활용하여 초기 주행 데이터 분포를 학습시키고, 이후의 주행 데이터를 입력해 재구축 오차를 계산함으로써 노후화로 인해 발생하는 분포 변화를 정량화 하였다.


3. 누적합 재구축 오차 기반 모델을 활용한 건전성 지표 구축 개발

재구축 오차 기반 모델을 단순히 활용한 결과, 정량적 및 정성적 평가에서 제안된 건전성 지표가 차량의 노후화를 제대로 반영하지 못한다는 점이 확인되었다. 이는 재구축 오차의 변동성이 크고, 노후화에 따른 분포 변화를 정확히 탐지하지 못했기 때문이다. 이를 해결하기 위해 관리도의 일종인 누적합 기반 관리도 기법을 도입하였다. 누적합 관리도는 감시통계량과 목표값의 차이를 누적해감으로써, 미세하게 변한 공정을 탐지하는데 유용하다는 특징을 가지고 있다. 본 프로젝트에서는 해당 특징을 활용하여 재구축 오차를 누적함으로써 노후화로 인해 발생하는 미세한 분포 변화를 탐지하였으며, 정량적/정성적 평가에서 모두 성능이 향상된 것을 확인할 수 있었다. 특히, 정성적 평가에서 노후화가 시간에 따라 증가하는 모습과 더불어, 특정 부품 교체와 같은 이벤트 발생 시 건전성 지표가 감소하는 양상을 보여주어, 차량의 노후화를 효과적으로 반영하는 지표를 개발하였음을 입증했다.