- 2025년 4월 28일 오전 11:58
- 조회수: 38

[학회 후기]
4.24~4.26 강남 노보텔 호텔에서 진행한 2025 12th International Conference on Industrial Engineering and Applications에 참석하였다. 작년에 이어 두번째 참석하는 학회였는데, 그때와는 또 다른 느낌으로 다가온 설레는 학회였다. 발표 장소가 조금 비좁은 장소로 배정되었던 것이 조금 아쉽지만, 후회없이 발표하고 와서 유의미한 학회였다.
[발표 후기]
Open-Set Semi-Supervised Learning with Trainable Open-Set Probability Model for Image Classification 발표 (임새린)
이번 학회에서는 현재 진행 중인 open-set semi-supervised learning (OSSL) 관련 연구를 발표하였다. Semi-supervised learning (SSL)은 labeled data에 대한 의존성을 줄이기 위해서 unlabeled data를 활용하는 학습 방법이다. 일반적인 SSL 방법론들은 labeled data와 unlabeled data의 class distribution이 동일한 close-set 시나리오를 가정한다. 하지만, 현실에서는 unlabeled sample의 클래스를 일일이 확인할 수 없기 때문에 unlabeled data에 OOD sample이 존재하는 open-set 시나리오에서 SSL 방법론을 검증해야 한다. 하지만, 기존 SSL 방법론들이 open-set 시나리오에서 성능이 하락함이 밝혀졌고, 이를 해결하기 위해 연구된 분야가 OSSL이다. 본 연구에서는 One-vs-All (OVA) network를 활용하여 각 클래스별 이상치 점수를 추정하고, 이상치 점수와 분류기에서 출력된 logit vector를 결합한 OOD detection module을 제안하였다. 또한, 데이터 효율성을 높이기 위해 OOD sample을 활용하는 것 역시 중요하다. 따라서, OOD sample을 활용할 수 있도록 open-set consistency regularization (OSCR) loss를 제안하였다. 특히, OSCR loss의 gradient analysis를 통해서 제안한 손실 함수가 OOD detection에 도움이 된다는 것을 이론적으로 보여주었으며, 실제 실험 결과에서도 다른 방법론 대비 OOD detection 성능이 좋음을 확인하였다.
질문 1: 제안 방법론과 비교 방법론인 IOMatch의 차이점을 설명해주실 수 있습니까?
답변 1: 제안 방법론과 IOMatch의 가장 큰 차이점은 학습에 활용하는 손실 함수입니다. IOMatch는 OOD sample을 활용하기 위해 k+1 분류기를 사용합니다. 이 때, 활용되는 손실 함수는 일반적인 close-set consistency regularization입니다. 반면에 제안 방법론에서는 OOD sample을 활용하기 위해 open-set consistency regularization을 사용합니다.
질문 2: 제안 방법론과 IOMatch의 성능이 매우 비슷합니다. 그 이유가 무엇입니까?
답변 2: 맞습니다. 현재 제안 방법론의 한계점은 ID sample을 OOD sample로 너무 많이 예측하는 over rejection 문제입니다. 이 문제를 해결하기 위해 mix-up augmentation을 도입할 계획이며, 이 문제를 해결한다면 성능이 더 올라갈 것으로 생각합니다. 또한, 현재 분류 성능은 비슷하지만, OOD 탐지 성능을 IOMatch보다 좋은 것을 확인할 수 있습니다. 이 점은 제 제안 방법론의 강점이라고 생각합니다.
[청취 후기]
Application of GAN-based Data Augmentation and Filtering Methods for Imbalanced Grinding Wheel Specification Classification
본 연구에서는 grinding wheel specification classification 모델링 과정에서 발생하는 class imbalance 문제를 해결하기 위해 GAN 기반 data sampling 기법을 활용함과 동시에 더 좋은 퀄리티의 가상 데이터 생성을 위한 filtering 기법을 제안하였다. 특히, GAN 모델로 생성된 data를 filtering하기 위해 KNN 방법을 활용하여 가상 데이터의 사용 여부를 판단하였다. Grinding wheel specification data에 적합한 샘플링 기법을 찾기 위해 over sampling, SMOTE 등의 전통적인 샘플링 기법과 GAN 기반 방법론인 CTGAN, copularGAN을 활용하였다. 실험 결과, GAN 기반 방법론들의 성능이 전통적인 방법보다 좋은 성능을 보였으며, 본 연구에서 제안한 filtering 기법을 활용하면 성능이 더 향상됨을 확인할 수 있었다. 현실 문제를 해결하기 위해 문제점을 파악하고 그에 맞는 해결 방법을 찾아가는 과정을 이해하기 쉽게 설명한 깔끔한 발표였다.
질문: Filtering 적용을 안했을 때, CTGAN보다 copolarGAN 성능이 더 좋은데, CTGAN에만 flitering 기법을 적용한 이유가 있습니까?
답변: 맞습니다. 저희도 향후 제안한 filtering 기법을 copularGAN에 적용해 볼 예정입니다.