[학회 후기]

이번 산업공학회는 ZOOM을 통해 화상으로 진행되었다. 작년 산업공학회를 청취하며 내년에 어떠한 주제로 발표하게 될지 상상하던 모습이 생생한데, 벌써 1년이라는 시간이 흘러 온라인으로 발표를 마무리한 것이 아직 믿기지 않는다. 온라인으로 진행되어 다양한 발표를 접해 볼 수 있다는 장점을 통해 연구적인 시야를 넓힐 수 있는 기회였다. 세션장의 현장감을 느껴보지 못한 아쉬움이 남지만, 내년에는 모두 건강한 모습으로 오프라인 학회에 참석할 수 있길 바라본다.

 

[발표 후기]  

머신러닝을 활용한 응급실 내원 환자 퇴실 조치 조기 예측 분석주제로 발표를 진행하였다. 해당 연구는 응급실 진료 후 퇴실조치(귀가, 일반병실 입원, 중환자실 입원, 전원)을 조기 예측하여 환자의 안정성 확보와 응급실 혼잡도 문제 완화에 도움이 되고자 시작되었다. 입원이 필요한 환자의 경우, 조기 식별을 통해 병원 내 자원의 최적화 도모가 가능하고 전원의 경우, 119와 같은 이송기관에 조기에 정보를 제공하여 구급차 수급 문제에 활용 가능하다. 전국 단위의 응급환자 진료 관련 정보를 활용하여 국내 응급의료환경에 적합한 분석 진행하였다. 응급실 퇴실 조치 결정을 조기 예측하고 이에 영향을 끼치는 요인들을 파악하여 해석 가능한 예측 모형을 개발하였다. 또한, 데이터 특징을 고려하여 범주형 변수가 많은 데이터에 적합한 모델을 선정하여 높은 분류 성능을 산출하였다. 더불어, 개별 환자의 퇴실 조치에 중요한 변수 파악 가능하여 결과에 대한 해석이 가능하다. 첫 학회 발표이고 온라인으로 진행되어 걱정 반 기대반으로 발표를 시작하였고, 다행히도 준비한대로 무난하게 마무리되었다. 질의응답을 통해 추후 연구 방향성이나 연구 한계점에 대해서도 다시 생각해보는 시간이었다.

 

[청취 후기] Markov kernel discriminant analysis for categorical sequence embedding, 조윤상

해당 발표는 시간 흐름에 따라 수집된 범주형 데이터를 효과적으로 임베딩하는 방법에 대한 연구를 주제로 진행되었다. 범주형 데이터를 임베딩하는 전통적인 방법으로는 해당 범주를 카운트하거나 one hot encoding방식 등이 있다. 하지만 이러한 방법은 시간 정보를 담지 못하고 변수의 수가 급증하는 문제점을 가지고 있다. Markov kernel 개념을 활용하여 이전 n step까지를 고려하여 효과적으로 임베딩하는 방식을 제안하셨다. 최근 딥러닝을 이용한 임베딩 방법론들이 많이 나왔음에도 불구하고 거의 비슷하거나 더 좋은 성능을 보였고 GPU를 사용하지 않아도 time complexity 관점에서 굉장히 우수한 성능을 보이고 있어 뛰어난 결과를 보인다고 생각했다. 연구를 진행하며 최종 정확도에 대한 성능도 중요하지만, 모델 경량화와 시간 단축 또한 전체 분석 업무에서 중요하다고 느끼고 있었는데 이러한 관점에서 인상깊은 연구라고 생각된다. 또한, 임베딩 방법론이므로 차원 축소의 효과까지 도출할 수 있어 시각적으로도 다른 연구에 비해 뛰어남을 확인할 수 있었다.  

 

[청취 후기] 불확실성 기반 Reject option을 활용한 wafer map 불량 패턴 분류 반자동화

반도체 공정의 wafer map 불량 패턴 분류를 위해 다양한 연구들이 진행되고 있지만, 현업에 적용하기 위해서는 완벽에 가까운 분류 정확도가 필요하다. 정확도가 100%에 가까운 분류 모델을 만들기에는 불가능하기 때문에, pre-trained된 분류 모델에 예측 불확실성이 높은 일부 인스턴스에 대해서는 reject을 하는 옵션을 추가하여 분류 모델의 최종 예측 정확도를 완벽에 가깝게 향상시키는 연구이다. CNNsoftmax layer는 불량 패턴이 각 범주에 속할 확률을 의미하기 때문에, 이 값을 사용하여 uncertainty를 구하고 기준 값을 정하여 reject을 진행한다. Accept된 인스턴스에 대해서는 굉장히 높은 성능을 보이며 분류 테스크를 풀고 reject된 인스턴스에 대해서는 휴리스틱하게 전문가가 판단하여 분류를 진행한다. 해당 발표를 통해 Uncertainty quantification의 개념을 접할 수 있고, 기존 Uncertainty연구와는 약간 다른 방향성으로 풀어 크게 2가지 트랙으로 접근한 것 같아 참신하다고 생각했다. 하지만, 클래스 불균형이 심한 데이터에는 적용하기에 어려움이 있을 것이라고 생각된다. 핵심 개념으로 인용된 논문을 찾아 이론적으로 공부해보고 싶다.