고려대학교 DMQA 연구실

2022 대한산업공학회 추계학술대회 - 김성수

2022년 11월 8일 오후 7:44
조회수: 4095

Reviewed by

김성수

[학회 후기]

바다를 품은 인천대학교에서 11월 4일에 개최된 2022년 대한산업공학회 추계학술대회에 참가하였다. 특히, 운 좋게도 코로나가 잠잠해져서 첫 학회를 온라인이 아닌 오프라인으로 경험할 수 있었다. 학회를 처음 경험하기에 어떠한 분위기일지 도저히 감이 안 왔지만 생각 이상으로 뜨거운 현장이었다. 이러한 분위기 속에 학회가 처음이었던 만큼 꽤나 긴장을 했지만, 한편으로는 설렘도 함께 존재하였다. 개인적으로는 이번 학회 발표를 일반 세션이 아닌 석사논문경진대회 특별 세션에서 진행했기에 더더욱 의미가 있었다. 본선을 진출한 전국 산업공학 인재들의 수준 높은 발표들을 청취할 수 있었으며, 덕분에 많은 자극을 받아 갈 수 있었다. 또한, 개인발표가 끝난 후 쉬는 시간에 애리조나 주립대 교수님께서 발표를 재미있게 들었다며 여러 가지 질문을 해 주셨는데, 이때 연구에 대한 희열감을 느꼈고, 학회가 교류의 현장이라는 말을 온몸으로 느낄 수 있었다. 결과적으로는 우수상을 수상하여 아쉬운 마음도 있지만, 내가 준비한 것을 모두 보여주고 왔기에 후회는 없다. 오히려 추후에는 보다 완성도 높은 연구, 그리고 참신한 연구를 수행하고 싶다는 마음을 되새김질할 수 있는 좋은 기회였다. 더불어 이번 학회는 발표 당일도 물론이지만, 준비과정에서도 선배들의 연구/논문/발표 노하우를 많이 배워갈 수 있었다. 이 자리를 빌려 학회 그리고 대회 준비에 도움을 준 지윤 누나, 이경이, 진수 형, 용원이 형에게 감사하다는 말을 전한다.

[발표 후기]

이번 학회에서는 “장면 이미지 속 한글 문자 인식을 위한 글자 단위 일관성 정규화 기반의 준지도학습 모델”을 주제로 발표를 진행하였다. 장면 이미지 속 문자 인식이라는 연구분야는 데이터가 많은 영어에 대해서 활발하게 진행되고 있으며, 한글에 대해서는 아직 저조한 실정이다. 왜냐하면 한글은 학습할 데이터가 적을 뿐만 아니라 유사한 글자가 다수 존재하고, 학습해야 할 글자의 개수도 2,350개로 매우 다양하기 때문이다. 따라서 본 연구는 이러한 문제를 해결하기 위해 Unlabeled 데이터를 활용하고, 자음과 모음으로 구성되어 한 개 글자에 정보가 많다는 한글의 특성을 반영하여 글자 단위로 모델링을 함으로써 이를 극복하고자 하였다. 이때 본 연구는 Unlabeled 데이터를 활용하기 위해 준지도학습을 활용하였으며, 일반적인 준지도학습이 아닌 문자 인식에 적합한 글자 정렬 및 글자 단위 일관성 정규화를 활용한 준지도학습 모델을 제안하였다. 실험결과 본 연구의 제안방법론은 기존 지도학습 및 준지도학습 문자 인식 모델보다 좋은 성능을 보였으며, 본 연구에서 새롭게 제안하는 글자 정렬 및 글자 단위 일관성 정규화의 효과도 실험을 통해 입증할 수 있었다. 이는 한글이나 한자와 같이 글자 하나에 많은 정보가 있는 문자에 대해 문자 인식 모델을 구축할 때 방향을 제시할 수 있으며, 현업에서 데이터가 적은 상황에서 해결 가능한 솔루션을 제시한다는 의의를 갖는다. 그러나 본 연구는 아직까지 수평으로 작성된 문자열에 대해서만 좋은 성능을 보이고, 수직 문자열에 대해서는 아직 효과가 입증되지 못했다. 따라서 후속연구에서는 수평 및 수직 문자열까지 인식이 가능하도록 연구를 확장하고자 한다.

질문1) 문자 인식 모델에서 이미지 내 각 글자들을 순차적으로 디코딩하는 모델을 활용한 이유가 있는가? 오히려 한 번에 모든 글자를 예측하는 것이 더 좋은 성능을 보일 것 같은데, 어떻게 생각하는가?

답변1) 최근 이러한 문자 인식 연구에서 디코딩에 관한 연구 사례들을 살펴보면, 이전에는 CTC 기반 알고리즘을 활용하다가 최근에는 Attention 기반의 메커니즘을 활용하여 좋은 성능을 보인 연구가 다수 존재한다. 이때 CTC기반 알고리즘이 말씀해주신 것처럼 한 번에 모든 글자를 예측하며, Attention기반 메커니즘은 제가 연구에서 활용한 것처럼 순차적으로 글자들을 예측한다. 따라서 본 연구도 최근 연구동향에 발맞춰 더 좋은 성능을 보이는 순차적으로 예측하는 구조를 활용하였다.

질문2) 본 연구는 글자 정렬과 글자 단위로 임계값과 비교하는 두 가지 필터링을 통해 학습에 방해가 되는 데이터를 제거한다. 그렇게 설정한 이유가 있는가? 예를 들어, 부스팅 계열의 모델은 모델이 잘못 예측한 것에 가중치를 주어 오히려 잘못 예측된 것을 통해 학습하는 것이 더 큰데, 제안한 연구는 오히려 반대 흐름을 갖고 있기에 어떤 아이디어에서 출발한 것인지 궁금하다.

답변2) 본 연구에서는 Unlabeled 데이터를 활용하기 위해 준지도학습을 하였다. 잘못 예측한 것에 가중치를 주는 것도 정말 좋은 아이디어라고 생각하지만, 해당 데이터를 잘못 예측했는지 알기 위해서는 레이블을 필요로 한다. 본 연구에서 제안하는 데이터 필터링 과정은 Unlabeled 데이터를 활용하는 과정에 적용하였는데, 해당 데이터들은 레이블이 없으므로 잘못 예측한 여부를 판단하기가 쉽지 않다. 더불어 이러한 틀린 정도를 정량화 하는 것은 더더욱 어렵다. 따라서 본 연구는 Unlabeled 데이터 특성상 데이터가 풍부하고, 해당 데이터의 정확한 예측여부도 알 수 없기에, 학습에 활용하지 않는 방향으로 연구를 수행하였다.

[청취 후기]

1. MADFlow: Normalizing Flow를 활용한 다변량 시계열 이상탐지 (문지원, 백준걸 – 고려대학교 산업경영공학과)

본 연구는 시계열 데이터에서 시간적 요인을 반영한 이상치 탐지 모델링에 관한 연구를 수행하였다. 최근 존재하는 이상치 탐지 모델들은 이러한 시간적 요인을 반영하지 않으며, 시간적 요인을 반영한다고 해도 Local minimum에 빠지는 문제가 존재한다. 따라서 본 연구는 이러한 한계를 극복하기 위해서 고차원 변수 간의 상관관계와 시간 상의 의존관계를 동시에 고려하여 이를 극복하고자 하였다. 본 연구는 먼저 고차원 변수 간의 상관관계를 학습하기 위해서 Temporal Encoder를 활용하였으며, 시간 상의 의존관계를 고려하기 위해 Normalizing Flow를 활용했다는 특징을 갖는다. 실험 결과 본 연구에서 제안하는 MADFlow는 기존 방법론 대비 학습시간이 짧게 소요되지만, 더 우수한 성능을 보여주어, 빠른 대응이 필요한 현업에서 적절하게 활용될 수 있다는 의의를 갖는다. 이번 추계학술대회에서 Normalizing Flow라는 개념이 들어간 발표들을 학술대회 책자에서 많이 볼 수 있었다. 이번 학회를 통해 Normalizing Flow라는 키워드를 하나 배워갈 수 있었으며, 추후 비슷한 과업이 주어진다면 이를 활용하여 문제를 해결해보고자 한다.

2. 관측치 간 공간적 유사성과 변수의 상관관계를 고려한 반도체 웨이퍼 테스트 데이터의 결측치 대체 방법 개발 (김주영, 김광재 – 포항공과대학교 산업경영공학과)

본 연구는 반도체 공정에서 웨이퍼 테스트 데이터가 공정 상의 이유로 결측치가 많은 것에 주목하였다. 이때, 모델링을 위해서 결측치를 대체하는 과정을 거치는데, 일반적인 방법으로 결측치를 대체할 경우 실제 데이터의 평균과 멀어지는 추정 편향 문제가 발생할 수 있다는 한계를 지닌다. 따라서 본 연구는 웨이퍼 테스트 데이터에 존재하는 칩 간의 공간적 유사성과 검사 항목 간의 상관관계를 고려한 결측치 대체 방법을 제안한다. 이때 본 연구는 입력 데이터에 상대적인 위치정보를 추가하여 위치 간 증감 경향성을 반영하였고, 결측치 대체 전후의 검사 항목 간 상관관계를 보존하기 위해서 GAIN의 손실함수를 수정하였다. 본 연구의 효과는 실험을 통해 입증할 수 있었으며, 향후 웨이퍼의 수율 및 품질관리에 기여할 수 있다는 의의를 갖는다. 결측치 이슈는 어느 도메인에서나 중요한 문제로 떠오른다. 본 연구는 이러한 결측치를 단순하게 대체하는 것이 아닌, 데이터의 특성을 고려하여 결측치를 대체한다. 따라서 본 제안방법론은 보다 합리적인 근거로 결측치를 대체한다고 할 수 있으며, 비슷한 형태를 가진 데이터에서 효과적으로 활용될 수 있을 것으로 사료된다.

Conference