- 2018년 4월 9일 오후 9:29
- 조회수: 2043
이지윤
[참여 후기]
처음으로 참가하는 2018년도 춘계공동학술대회는 '비즈니스 애널리틱스와 스마트 경영'이라는 주제로 호텔 현대에서 진행되었다. 주제에 부합하듯 '비즈니스 애널리틱스'와 'Smart Factory'분야의 세션비중이 높았으며, 반도체 도메인에서의 다양한 데이터 분석을 접해볼 수 있는 자리였다. 학회를 참여하기 앞서 연구실 선배들이 각자의 발표를 준비하는 과정을 보면서 해당 내용에 대해 충분히 숙지하는 것 뿐만 아니라 발표자로서의 태도가 얼마나 중요한지 배울 수 있었는데 이러한 점은 학회에 가서 더 뚜렷하게 비교해볼 수 있었던 것 같다. 청자들이 처음 접하는 내용임에도 불구하고 거부감 없이 설명하는데 있어서 우리 연구실 선배들이 발표를 잘한다고 느꼈다. 첫 학회였기 때문에 내가 하고자 하는 연구분야의 방향성을 잡기위해 최대한 다양한 연구분야를 접해보자는 목적을 갖고, 능동적으로 참여하여 최대한 발표내용을 수용하려고 노력하였으나 듣고 싶은 세션이 같은시간에 배치되어있어 아쉬움이 있었고, 아직은 생소한 발표내용을 이해하는데 있어서 어려움이 있었다. 반면 수업시간에 배우거나 연구실 세미나에서 다루었던 주제에 대한 내용이 나오면 이해하는데 상대적으로 수월했었던 것 같다. 학술기간동안 느꼈던 이처럼 이해가 부족한 부분에 있어서는 꾸준히 학습하여 다음 학술대회에는 지금보다 더 많은 내용을 배워갈 수 있기위해 노력할 것이며, 나 또한 선배들처럼 관심분야에 대해 충분히 숙지하여 능숙하게 발표하는 모습을 상상해볼 수 있었다. 다시 한 번 학회에서 산업공학도들의 열정을 느낄 수 있어 유익 하였고, 연구실 밖에서 선배들과 함께 즐거운 시간을 보낼 수 있어 너무 뜻깊은 시간을 보낼 수 있었다.
[청취 후기]
- 설비 고장 예지 진단을 위한 머신러닝 기반 건강도 지표
설비들의 상태를 진단하기 위한 척도로 설비 건강도인 HI스코어를 사용하는데, 기존의 HI점수 산출방식에 있어서는 전문가의 개입으로 인해 주요 항목임에도 모델로 부터 산출된 최종 HI점수에 크게 반영이 되지 않아 실제 설비상태와 산출된 HI점수가 상이하다는 문제가 있었다. 하지만 설비들의 고장을 예측하고, 상태를 파악하는 것은 매우 중요하며 따라서 HI점수를 정확히 예측해야 한다. 해당 연구는 이를 해결하기 위해 각 평가 항목의 중요도와 각 상태 그룹의 특성을 반영할 수 있는 모델을 구축하고자 했고, Classification과 Regression으로 나누어진 두단계 예측 방법을 사용하였다. 먼저 설비의 상태를 점수들의 조합으로 Classification을 하고, 해당 상태 내에서 HI점수를 Regression을 통해 예측하게 되는데, 이는 기존의 단순 가중합을 사용하는 경우보다 결과적으로 좋은 성능을 보였다. 해당 연구는 다양한 설비들에 범용적으로 적용해 볼 수 있을 것이라는 점과 해당 작업자가 Parameter값을 통해 직관적으로 파악해 볼 수 있을 것이라는 점에서 상당히 흥미로웠고, 최근에 수업시간에 배운 회귀분석에 대한 내용이 포함되어 있고, 차분한 발표가 이해하는데 도움이 되었던 것 같다.
- 반도체 다채널 센서 데이터 분석을 통한 주요 인자 선택 알고리즘
반도체 설비는 매우 기술집약적인 분야이기 때문에 품질을 계측하여 상태를 판단하고 최종적으로 수율을 높이는 것이 중요한 사항이다. 하지만 수백 수천에 달하는 공정과 장비로 인해 웨이퍼의 계측 값들의 패턴을 구축하는 것에 어려움이 있으며, 샘플링 되지 않은 웨이퍼가 Outlier인 경우가 있기 때문에 이들를 가상적으로 예측하는 '가상계측'이 매우 중요하다. 해당 연구는 반도체 8대 공정중 Etching공정의 설비에 부착되어 있는 센서로부터 데이터를 수집하고, 이를 기반으로 예측하는 것을 목적으로 했다. 따라서 해당 센서에서 발생하는 다양한 변수들을 축소시키고자, 총 8개의 요약통계량들의 상관관계를 분석하여 임계치를 넘은 값을 제거하여 값을 대변하는 변수와 범위를 대변하는 변수인 2개의 요약통계량으로 축소시켰고, 다량의 종속변수 값이 나오는 Multi-outputs구조이기 때문에 이를 해결하기 위해 Categorical변수를 추가하고, 이들이 Dummy Variable로 변환되어 단일 종속변수 구조로 변환하였다. 이후 PLS, Boosting Tree, Random Forest 로 보델링하여 더 좋은 성능을 보이는 것을 확인할 수 있었다. 최근 다변량 통계분석 수업에서 다루었던 Correlation값들의 차원축소의 개념과 Categorical변수의 분석을 위한 Dummy variable의 개념까지 적용시켜 볼 수 있어서 상당히 흥미로웠고, 기존의 변수들에서 간단한 개념만으로 주요변수들을 추출하여 관리자입장에서 품질에 대한 해석이 용이할 것이라는 기대와 공정 관리의 효율을 향상시켰다는 점에서 의미있는 연구였다고 생각한다.
- 다양성 지수 기반의 핵심 키워드 탐색
해당 연구는 계량 서지학 분야에서 중요 키워드를 추출해내는데에 목적을 두었다. 기존 키워드 탐색 방식은 단순히 해당 키워드의 Frequency와 Centrality로 판단되었으나 이는 General한 단어들을 추출해낼 수 있다는 한계점을 지적하며, 보다 Special한 단어를 추출하기 위해 진행된 연구였다. 대표적인 키워드 탐지 방법인 TF-IDF에서 IDF에 해당되는 term을 I-Gini index와 I-Stirling index로 변환하여 General한 키워드에는 패널티를 주는 방식으로 변환하여 성능을 비교하였고, 결과적으로 위 실험에서는 TF-IStirling의 경우 가장 우수한 성능을 보였다. 이는 I-Stirling term에는 거리의 개념이 포함되어 문서간의 연관관계를 고려하기 때문이라고 설명해주셨다. 하지만 직관적으로 이해가 가지 않아 해당 Term들에 대해 조금더 구체적으로 설명해주었으면 결과를 이해하는데 있어서 더 도움이 되었을 것 같다는 아쉬움이있었다. 그럼에도 불구하고 텍스트마이닝 분야에서 가장 기초적이자 중요한 비중을 차지하는 키워드 탐색에 있어서 간단한 변환을 통해 기존의 방법보다 좋은 성능을 보였다는 점이 상당히 흥미로웠다. 추후 추가적인 검증과 위 기법을 직접 적용한 사례연구까지 발전시킬 수 있으면 더욱 좋을 것 같다.
- 강화학습을 활용한 반도체 포토리소그래피 공정의 Overlay Mark 최적 배치
반도체의 웨이퍼 내의 Unit은 필드로 구분되는데 웨이퍼의 상태를 계측하기 위해 필드내의 Vernier Key에서 Overlay를 측정한다. 따라서 Overlay를 제어하는 것이 반도체 공정상 매우 중요한 이슈이다. 해당 연구는 필드 내에 다양한 Vernier Key를 구축할 수 있지만, 이는 공정상에 제약을 주기 때문에 최소한의 Vernier Key에서 강화학습을 통해 Overlay의 위치정보를 채택하고자 하였다. 따라서 어떠한 Vernier Key가 선택되었는가를 상태(s)로, 몇번째 Vernier Key를 선택하는가를 행동(a)로, 이에 대한 회귀결과의 적합성을 보상(r)로 모델을 구축하였고, 강화학습 알고리즘으로는 deep Q-learning을 이용한 연구였다. 특히 한개의 Agent를 활용하여 보상을 주는 방식으로 학습을 시키지 않고 두 Agent를 활용하여 평가지표가 좋은 Agent에 보상을 부여하고, 그렇지 못한 Agent에는 패널티를 부여하는 방식으로 학습을 시킨 다는 접근 방식이 신선하였고, 해당 연구는 강화학습에 대해 관심을 갖게되는 좋은 계기가 되었다고 생각한다.