- 2019년 4월 15일 오전 10:41
- 조회수: 748
도형록
이번 BI conference는 서울 코엑스에서 진행되었다. Neural network와 관련된 발표들이 많았던 것이 특징이었으며, 이전과는 다르게 단순 neural network 적용이 아닌, 다양한 문제를 풀기 위한 방법론을 제시한 것 같다.
[발표 후기]
주제: Binary Classification via Class Description Network
요약: 본 연구에서는 일반적인 classification 문제에 더해, testing 단계에서 training data에 포함되지 않은 unseen class에 대한 recognition이 가능한 classifier에 대해서 다루었다. 제안하는 방법론인 class description network는 neural network를 통해 학습된 feature space에서 각각의 class를 잘 설명하는 compact한 hypersphere를 학습한다. 이를 통해 새로운 관측치가 입력되었을 때, 어떤 class에 해당하는지, 또는 어떠한 class에도 해당되지 않는지에 대한 판단을 수행할 수 있다. 제안하는 방법론은 image benchmark data set을 통해 검증하였으며, support vector class description 알고리즘과 CNN classifier와의 비교를 진행하였다.
Q1. CNN Classifier를 통해 unseen class를 탐지하는 방법에서, threshold를 0.7로 설정한 이유는 무엇인가
A1. Threshold를 0.7로 설정해야만 하는 특별한 이유는 없으며, 비교방법론이기 때문에 정교하게 hyperparameter tuning을 하지 않은 것이다. 추후 실험에서는 비교해보는 것도 좋을 것 같다.
Q2. 제안하는 방법론에서 각 class를 설명하는 hypersphere가 겹치는 경우에는 어떻게 예측을 수행하는가
A2. Hypersphere가 겹치는 경우, 각 class의 hypersphere의 center까지의 거리를 비교하여 더 가까운 class로 판단하는 방식 등이 있으나, 진행한 실험에서는 neural network의 특성 때문인지, 실험 데이터가 단순하기 때문이었는지 겹치는 경우가 없어서 특별히 언급하지 않았다.
Q3. Unseen class를 또 다른 하나의 class로 두고 3-class classification 문제를 푼 것과 비교해 보는 것도 좋은 실험이 될 것 같다.
A3. 좋은 baseline이 될 수 있을 것 같다.
[청취 후기]
InfoAnoGAN을 이용한 해석 가능한 비지도학습 기반 이상치 탐지 방법
최근 anomaly detection을 위해 deep generative model을 이용하는 연구가 활발하게 진행되고 있다. Deep generative model 중 하나인 generative adversarial nets (GAN)을 이용하여 anomaly detection을 수행하는 모델은 AnoGAN이 대표적인데, 발표에서는 AnoGAN을 이용하여 이상치를 탐지하고, 어떤 특성 때문에 이상치로 탐지되었는지를 확인하려는 시도를 진행하였다. InfoGAN을 이용하여 latent variable들이 interpretable representation을 갖도록 학습시키고 latent variable들 중에서 어떤 값이 정상 데이터와 다른지를 확인하겠다는 아이디어인데, 아직 많은 연구가 필요한 것 같았다. 정상 데이터 만으로 학습된 GAN이 정상이 아닌 관측치에 대해서 적절한 latent representation을 찾을 수 있을지에 대해서는 확실하지 않다고 생각한다. 하지만 시도 자체는 의미있는 것 같다. Deep unsupervised representation learning 방법론들이 전반적으로 interpretable model을 찾기위해 연구되고 있기 때문이다. 향후 연구 방향으로 설정한 것들 중, latent variable간 mutual information을 minimize하겠다는 부분은 재밌는 것 같다. 아주 쉬운 방법을 통해 구현될 수 있을 것 같지는 않지만 GAN 또는 VAE type의 모델에도 적용할 수 있다면 의미있을 것이라고 생각한다.