<발표후기>




이번 학회에서는 고차원 데이터 모니터링을 위한 Variational Autoencoder 기반 관리도를 주제로
발표하였다. 가장 전통적인 다변량 관리도는 hotelling's T2인데, 이 방법은 변수의 수가 많으면서 변수간 상관관계가 높은 경우 효과적이지 않다.
이 한계점을 극복하기 위해 차원축소 기법들(PCA, KPCA, Autoencoder )이 적용되어 왔는데, 대부분의 방법들이 축소된 공간에서의 데이터의
정규성 가정에 대해 보장하지 않는다. T2 통계량은 데이터의 분포가 정규분포를 따를 때 모니터링 성능을
보장할 수 있기 때문에 정규성 가정은 쉽게 간과하면 안 된다. 따라서 제안하는 연구에서는 축소된 공간을
정규분포로 추청하는 variational autoencoder를 사용하였다. 실제 기존 variational autoencoder가 초기에 차원축소를
하기 위해 제안된 방법은 아니지만, 잠재변수를 확률분포(정규분포)로 추정하는 부분이 T2 관리도의 기본적인 가정에 부합하기 때문에
좋은 성능을 나타낸다. 실제 시물레이션과 실제데이터 적용에서도 제안 방법이 기존 방법들 보다 좋은 성능을
보임을 확인했다. 제안 방법의 우수성이나 타당성을 청중이 이해할 수 있도록 기존 연구들의 흐름 및 한계점을
설명하는데 집중해서 장표를 구성하였다. 예상보다 세션에 청중들이 많아 발표를 시작할 때 조금 긴장했지만
고개를 끄덕여주는 청중을 보며 말을하니 금방 안정적이게 할 수 있었다.

 



-질문사항



질문1. 왜 정규분포에서도 제안방법의 성능이 좋은가?



: 이건 고차원 데이터에서 거리 계산의 문제라 생각한다. 실제 변수를 50개로 했을 때는 제안방법과 비교 방법들의 결과가
유사했었는데, 변수 개수가 100이상으로 한 경우 (실험에서는 500) 제안방법이 이상탐지를 더 잘함을 확인했다. - 실험 결과는 좋게 나왔지만 대답은 조금 미흡하다 생각이 들었다. 다시
한번 왜 더 좋은 결과가 나왔는지 고민해 볼 필요를 느끼게 해 준 좋은 질문이었다.



 



질문2. 로그노말 분포에서 왜 획기적으로 제안방법이 좋은 성능을 보이는가?



: 이것은 차원 축소된 결과 장표를 보여주며 설명하였다. 다른 방법론들에서 축소된 차원에서 로그노말분포 형태를 보면 기존의 skewness
유지하고 있지만 variational autoencoder만 비교적 정규분포 형태로 축소된 공간에서
데이터를 표현하기 때문에 T2 관리도에서 좋은 성능을 보인다.



 



질문3. 실험에서 정상과 이상을 같은 개수로 실험하였는데, 만약 이상치를 적게 만들면 성능이 달라지지 않는가?



: 실제 모델을 구축할 때 정상데이터만 사용하기 때문에 이상 관측치의
개수가 모델 성능에 영향을 미치지는 않을 것입니다. 실제 가용할 수 있는 이상데이터가 충분히 있었기
때문에 같은 수로 두고 사용하였습니다.



 




<청취
후기>




1. 기계시스템 이상진단을 위한 Abrupt
분산분석 기반 멀티센서 시그널의 차원축소



요즘 PHM학회에서도 그렇고 산업공학회에서도 그렇고 예전보다 멀티센서
시그널 데이터에 대한 연구가 활발하게 진행되는 것 같다. 시그널의 경우 데이터를 변환하는 것이 중요한데
본 발표에서는 시그널 데이터 변환을 어떻게 효과적으로 할 것인가에 대해 다루었다. 실제 여러 센서 중에
변동이 크다고 해서 중요한 센서는 아니다. 이런 관점에서 Abrupt
분산분석을 적용하여 전체 변동은 같으나 데이터의 갑작스러운 변동이 있는 경우를 포착하는 센서를 선정하는 것을 목적으로 하였다. Abrupt variance는 시계열 데이터에서 Abrupt/steady 변화를
구분할 수 있는 통계량이다. 그리고 Discernibility
index
라고 해서 정상/이상 상태 데이터의 중복되는 면적을 고려하는 값으로 중요 센서를
찾는데 사용하였다. 우리 연구실에서도 몇 개의 유사 프로젝트가 진행되고 있는데 센서 선정에 있어서 고려해보면
좋을 것 같다.



 ​