- 2019년 4월 14일 오후 10:40
- 조회수: 494
이창현
[학회후기]
이번 한국데이터마이닝학회
춘계학술대회는 ‘사례를 통해 본 AI & BI’ 라는 주제로 COEX에서
진행되었다. 데이터마이닝학회 답게 최근 많은 이슈가 되고있는 딥러닝 분야의 연구가 많이 발표 되었다. 특히 인상에 남는 부분은 해석 가능한 모델이나 Attention 기반의
모델이 많이 활용이 되고 있다는 점이었다. 아직 이쪽 분야로는 연구를 해본적이 없었는데 이번 학회를
계기로 더욱 관심을 가지게 되었다.
[발표후기]
주제 : GASNet: Generation and Segmentation Networks for Identifying
Wafer Defect Patterns
반도체 공정에서 생산되는
Wafer Bin Map 이미지 내의 특정 불량 패턴을 분류하기 위하여 딥러닝 모델이 제안되었다. 하지만 모델의 학습을 위하여 필요한 충분한 양의 레이블된 데이터를 얻는 것은 아주 어렵다. 따라서 본 연구에서는 소량의 학습데이터를 이용하여 딥러닝 모델을 학습하는 방법론을 제시하였다. 소량의 학습데이터를 이용하여 생성모델을 학습하고 학습된 generator 를
이용하여 분류 모델을 학습시키는 방법을 채택하였다. 평가 결과 제안한 방법론에서 더 강건한 성능을 보임을
확인하였다. 웨이퍼 이미지 분류의 한 예를 들어 설명하였지만 이 방법론은 데이터가 부족한 상황에서의
딥러닝 모델을 더 강건하게 학습시킬 수 있는 방법으로 생각된다.
질문1 : 생성된 데이터의 정합성은 어떻게 검증하였는가?
일반적인 경우에서 데이터의
정합성은 실제 데이터와 생성된 데이터의 유사도를 확인하여 정합성을 볼 수 있겠지만 생성모델에서 생성된 데이터의 경우 기존 데이터와는 다른 새로운
데이터가 생성되기 때문에 직접적으로 유사도를 판단할 수 있는 방법은 없는 것 같다. 또한 실제 데이터의
수가 적기 때문에 더욱 비교하기는 어려워진다. 따라서 1차적으로는
생성된 데이터의 일부를 직접 눈으로 확인하여 의도한 데이터가 생성되는지 확인하는 방법을 이용하였고, 2차적으로는
생성이 잘 못되었다면 최종 분류 모델 학습에 방해요소가 되어 성능이 감소하기 때문에 결국 분류 모델의 성능이 생성 데이터의 정합성을 보장한다고
볼 수 있다.
질문2 : VAE 사용시 정규분포를 가정하였는데 이렇게 한 이유는? 문제는
없는지?
일반적으로 정규분포를
가정하고 사용하기 때문에 사용을 하였고, 불량 이미지의 경우 불량의 발생양상이 좀더 심하거나 약한 형태를
가지기 떄문에 각 샘플이 불량이 발생한 정도에 대하여 분포를 가진다고 볼수 있으므로 큰 문제가 되지 않는다고 볼 수 있다.
[청취후기]
InfoAnoGAN을 이용한 해석 가능한 비지도학습 기반
이상치 탐지 방법 (서울대, 박지혜)
이상치 탐지를 위해 딥러닝
기술이 도입되고 있으나, 블랙박스 모델인 경우가 대부분이라 어떠한 원인 때문에 발생하게 되었는지에 대하여
해석하는 것은 한계가 있다. 따라서 새로운 데이터가 주어졌을 때 어떠한 근거로 이 데이터가 정상인지
이상인지 판단할 수 있는 근거 역할을 할 수 있는 의미있는 특징 추출이 필요하다. 이를 위해서는 InfoGAN 을 이용하였고 Anomaly score 로는 AnoGAN 에서 사용하는 Residual loss 를 이용하였다. 이 연구에서는 두가지 방법론을 혼합하여 InfoAnoGAN 을 제안하였다. 평가결과 Efficient AnoGAN 대비 성능은 낮았지만 해석할
수 있는 부분을 가졌다는것에 의미가 있다고 볼 수 있다. 개인적으로 이 연구를 보면서 딥러닝 모델을
이용한 많은 방법론 중에 기존에 있던 모델을 합쳐서 새로운 모델을 만드는 경우가 많은데, 해석가능한
모델을 위해서 InfoGAN 을 활용했다는 것이 재미있었다.