[학회후기] 

한국데이터마이닝학회 추계학술대회는 ‘미래를 향한 데이터마이닝의 항해’ 라는 주제로 서울대학교에서 진행되었다. 데이터마이닝학회 답게 최근 많은 이슈가 되고있는 딥러닝 분야의 연구가 주를 이루었다. 관심있는 분야의 연구를 한곳에서 많이 접할 수 있어서 비슷한 주제더라도 사람에 따라 다르게 풀어나가는 것을 보며 나는 어떻게 적용할 수 있을지 고민해 볼 수 있어 좋았고 앞으로 진행할 연구에 많은 도움이 될 수 있는 좋은 경험이었다. 
 
[발표후기]
주제 : 변분 오토인코더와 세그넷 기반 이미지 내 불량 패턴 탐지
 
본 연구는 이미지내 특정 형태를 가지는 물체가 있을 경우 해당 물체를 탐지하고 구분해주는 것을 목표로 한다. 레이더 이미지와 같이 거리와 방향정보만 있는 이미지에서도 물체가 가지는 형태를 기반으로 패턴을 분석하여 어떠한 물체인지 확인할 수 있다. 제안하는 방법론을 검증하기 위하여 웨이퍼 이미지를 사용하였다. 웨이퍼 이미지에서도 특정 형태를 가지는 패턴이 존재하며 빠른 분석을 위하여 각 패턴 분류가 필요하다. 기존 연구에서는 웨이퍼내 불량 패턴의 존재 여부만 알 수 있는 웨이퍼 단위의 불량 패턴 탐지하는 모델을 제안하였다. 이러한 웨이퍼 단위의 불량 패턴 탐지는 단순히 웨이퍼 내에 해당 불량 패턴이 존재하는지에 대하여 확인하기 때문에 해당 불량 패턴이 어느 위치에 어느정도의 수량으로 발생되었는지는 알기 힘들다. 따라서 본 연구에서는 웨이퍼 단위가 아닌 다이 단위의 불량 패턴 탐지 모델을 제안한다. 다이 단위로 불량 패턴을 분류하였기 때문에 어느 위치의 다이가 어떤 불량 패턴 유형에 속하는지를 파악할 수 있고 어느정도의 다이가 해당 불량 패턴으로 발생되었는지도 확인이 가능하다. 하지만 이런 분류모델을 학습시키기 위해서는 충분한 양의 학습 데이터가 필요한데 레이블이 되어있는 학습데이터를 얻기는 어렵다. 본 연구에서는 소량을 샘들데이터로 충분한 양의 학습데이터 생성을 위하여 variational autoencoder 를 사용하였다. 생성된 학습데이터는 샘플 데이터의 특징을 잘 보존하고 있음을 확인 하였다. 이를 이용하여 모델을 검증한 결과 99%의 정확도로 불량 패턴을 분류 하였으며, 실제 데이터에서도 95%의 성능으로 불량 패턴 분류를 수행함을 확인 할 수 있었다. 이러한 방법으로 이미지내 존재하는 특정 패턴을 잘 분류할 수 있다. 

질문1 : 학습데이터 생성을 위해 사용한 샘플데이터의 분포를 먼저 알고 있어야 하나?
그렇지 않다. 그 분포를 모르기 때문에 정규 분포의 형태를 가지도록 학습이 되는 것이다. 정규 분포를 따르도록 학습이 되었기 때문에 해당 공간에서 샘플링하더라도 의미있는 학습데이터를 생성하였다고 볼 수 있다.
 
질문2 : 웨이퍼내 패턴을 분류한다는 것의 의미는?
여러가지 원인에 의해 불량이 발생되는데, 특정 공정 원인으로 불량이 발생할 경우에 특정 패턴 형태로 불량이 발생되게 된다. 따라서 불량 패턴을 구분하는 것은 불량 원인을 구분하는 것으로 볼 수 있다.
  
[청취후기] 
콘텐츠 피쳐 추출기와 자취 피쳐 추출기를 결합한 가짜 얼굴 탐지 모델
 
딥러닝의 발전으로 진위여부를 분간하기 어려운 가짜 얼굴 이미지가 생겨나고 있다. 가짜 얼굴은 미디어내 얼굴을 원하는 얼굴이나 표정으로 바꾸는 알고리즘을 사용하여 만들어지는데, 악용시 파급효과가 매우 크다. 개인의 프라이버시와 사회적 정치적 안보를 유지하기 위해 미디어내 가짜 얼굴을 탐지하는 모델의 개발이 필요한데, 이 연구에서는 얼굴 이미지를 콘텐츠 피쳐와 자취 피쳐를 동시에 추출하여 얼굴의 진위 여부를 판별하는 모델을 제안하였다. 데이터셋을 이용하여 평가한 결과 우수한 정확도를 보여주었으며, 비디오의 압출률 변화에도 강건함을 보여 주었다. 보통 연구에서는 어떻게 하면 더 합성을 잘 할까가 주를 이루고 있었는데, 이 연구에서는 어떻게 합성한 이미지를 구별해 낼까에 대한 내용이라 재밌게 들을수 있었고 콘텐츠 피쳐와 자취피쳐의 개념을 좀 더 공부하여 어떤 원리로 이루어 지는지 확인하고 내가 하고 있는 연구에 어떻게 적용해야할지도 고민해 볼 수 있는 좋은 발표였다.