[프로젝트 개요]

현재 디스플레이 공정 과정에서는 FDC 센서에서 수집된 값이 사전에 설정된 임계값을 넘으면 interlock이 발생하고 공정을 멈춘다. 하지만 사소한 이유로 interlock 이 발생하는 경우가 있으며 이 경우에는 전체 공정을 멈추는 것이 큰 손해로 이어진다. 본 프로젝트에서는 이러한 손실을 방지하기 위해서 interlock 발생 당시 수집된 FDC 센서 데이터를 통해 공정을 멈출지 다시 진행할지 분류하는 interlock auto release 모델을 개발한다. 또한, 공정이 바뀜에 따라서 변화하는 데이터 분포에도 모델이 잘 작동할 수 있도록 continual learning과 domain adaptation 기법을 추가적으로 적용한다.



[프로젝트 내용]

1. 딥러닝 기반 interlock auto release 모델 


본 프로젝트에서는 interlock 발생 전 수집된 두 시간 분량의 FDC 센서 데이터를 입력 데이터로 활용한다. 따라서 FDC 센서의 시계열성을 반영하기 위해 LSTM, Transformer를 베이스 모델로 선정하였으며, 성능 고도화를 위해서 최신 모델 구조인 Sequencer와 PatchTST를 추가적으로 활용하였다. 또한, 데이터 부족 문제를 해결하기 위해 데이터 증강 기법을 도입하였는데, 데이터가 가지고 있는 클래스 정보를 유지할 수 있는 Flip 기법을 활용하였다. 모델 성능 평가를 위해서 각 공정별로 데이터를 나누어 평가하는 Leave-one-out validation을 수행하였으며, 평가지표는 F1-score와 유출률을 활용하였다. 실험 결과, Sequencer가 가장 좋은 성능을 보였기 때문에 Sequencer를 최종 백본 모델로 결정하였다.




2. 데이터 분포 변화에 강건한 모델


디스플레이 공정마다 설비와 센서가 다르기 때문에 수집되는 FDC 데이터의 분포가 달라진다. 따라서 각 공정별로 interlock auto release 모델을 개발하는 것이 가장 효과적이지만, 디스플레이 공정은 많은 단계로 이루어져 있기 때문에 현실적으로 불가능하다. 이 문제를 해결하기 위해 본 프로젝트에서는 continual learning과 domain adaptation 기법을 활용한다. Continual learning은 분포가 변화된 새로운 데이터에 모델을 fine-tuning하면 기존 데이터에서 성능이 하락하는 catastrophic forgetting  문제를 해결하기 위해 연구된 분야로 본 프로젝트에서는 Elastic Weight Consolidation (EWC, PNAS 2017) 방법론을 활용하였다. Domain Adaptation은 추론 단계에서 학습 데이터와 분포가 다른 샘플이 입력되었을 때 성능이 하락하는 문제를 해결하기 위해 연구된 분야로 본 프로젝트에서는 Adversarial Multiple Source Domain Adaptation (MDAN, NeurlPS 2018)와 Domain Aggregation Neural Networks (DARN, ICML 2020) 방법론을 활용하였다. 



실험 결과, continual learning에서는 기존 데이터의 성능을 유지하면서도 신규 데이터에 높은 성능을 달성하였지만, domain adaptation에서는 신규 데이터에서 지도 학습보다 낮은 성능을 보였다. Domain adaptation에서 성능이 하락한 원인을 분석하기 위해 모델이 학습한 특징을 시각화 하였으며, 분석 결과 특정 공정들에서 FDC 센서 데이터의 패턴이 비슷하지만 클래스가 반대인 샘플들로 인해서 domain adaptation의 효과가 떨어짐을 확인하였다.