- With 삼성전자
- 2024-01-01 ~ 2024-12-31
반도체 공정은 순차적으로 FAB 공정을 수행하며 해당 과정에서 설비 정보, recipe정보, 가상 계측 정보 등을 수집한다. FAB 공정 이후 측정되는 제품 특성 값을 통해서 웨이퍼의 전기적 특성을 정량적으로 측정하고 불량 여부를 판단할 수 있다. 본 프로젝트에서는 반도체 FAB 공정 이력 기반 데이터 중 주요 공정 데이터만을 활용하여 다양한 제품 특성값 예측 및 효율적인 공정관리를 하기 위한 공정 별 주요 요인 해석 및 정량화를 목표로 한다. 이때, 주요 공정 데이터들에 대한 특성을 잘 추출할 수 있으면서 동시에, 다양한 제품 특성값들의 범위 차이를 반영할 수 있는 예측 모델을 구축하였다.
1. 입력 데이터(주요 FAB 공정 테이터) 특성을 효과적으로 추출할 수 있는 모델 개발
입력 데이터 특성으로는 다음과 같은 세 가지 특성이 존재한다.
- 순차성: 설비들이 유기적으로 연계되는 공정 특성 상 시간 흐름에 따라서 순차적으로 값이 수집됨
- 변수 독립성: 각각의 공정 step으로부터 수집되는 설비 정보와 recipe 정보는 서로 다른 고유한 특성을 가짐
- 국소적 패턴 변화: 전체 공정 step들 중 특성 시점에서 생기는 변화가 ET 예측에 중요한 영향을 미침
따라서, 설비와 recipe 별 특성을 고유하게 반영할 수 있는 모듈을 제안하며 동시에 공정 순차성 및 국소적인 값의 변화를 고려할 수 있는 모델을 제안하였다.
2. 출력 데이터(제품 특성값)들의 범위가 모두 다른 특성을 반영하기 위한 학습 알고리즘 개발
각각의 출력 데이터들은 값의 범위가 모두 다르다는 특성이 존재한다. 기존 회귀 모델에서 사용하는 MSE 손실함수를 통하여 학습을 할 경우, 출력 데이터에 대해서 학습적인 불균형을 야기할 수 있다. 따라서, 모든 출력 데이터들에 대해 공정하게 학습을 하기 위한 IQR-Weighted MSE 손실함수를 적용하여 학습적인 불균형을 해소하였다.
3. 모델 성능 평가 및 공정 별 주요 요인 해석
모델 성능 평가 시에는 기존 회귀 모델 성능 평가 지표들 외에, 출력 데이터들 값의 범위 차이에 의해서 예측 오차가 y 범위 내에서 얼마나 차지하는지 보여주는 normalized MAE 지표를 추가적으로 사용하여 성능 평가를 진행하였다. 실험 결과를 통해서 입력 데이터 특성을 반영할 수 있는 제안 모델인 CSE 모델이 다른 비교 방법론들에 비해서 모든 회귀 성능 평가 지표 상에서 더 우수한 성능을 보였다. 또한, 우측 실험 결과 표를 통해서 출력 데이터 특성을 반영하는 IQR-Weighted MSE 손실함수의 효과를 확인할 수 있다.
모델 성능 평가와 더불어서, 공정 별 주요 요인 해석을 진행하였다. 주요 요인 해석으로는 반도체 도메인 지식과 그에 해당하는 두 그룹별 모델링 해석 결과 비교를 통해서 주요 공정해석에 대한 정합성을 확인하였다.