2020년 대한산업공학회에 참석했다. 이번 학회는 온라인(ZOOM)으로 진행되었다. 첫 세션에 발표가 예정되어있어 연구실에 학회가는 기분으로 등교했다. 근데 그 학회 특유의 설렘은 오프라인이 더 좋은 것 같다. 첫 세션에서 발표했는데 좌장과 발표자들 모두 ZOOM회의에 익숙했었는지 수월하게 진행됐다. 다만 나는 마지막 발표였는데 시간이 부족하여 질문을 주고받지 못한 게 아쉬웠다. 다른 세션에서는 ZOOM 사용법이 익숙치 않았는지 버벅되는 세션도 있던 것 같다. 이번기회에 온라인 학회에 한번 더 익숙해졌다. 오프라인 학회보단 소통이 적고 학회의 그 어수선함이 느껴지지 않는 건 아쉽지만 오히려 더 다른 발표에 잘 집중되는 장점도 있었다. 학회 세션은 자가지도학습(self-supervised learning) 및 딥러닝 (deep learning) 응용 연구가 주를 이루었고, 이번 학회에선 자가지도학습 응용연구에 관심을 갖고 청취했다.

[웨이퍼 맵 패턴 군집을 위한 합성곱 오토인코더를 활용한 자가 지도학습 기반의 동적 클러스터링]- 김동화, 강필성(고려대학교 산업경영공학과)
DSBA 연구실 연구원이 발표해준 내용이다. 반도체공정에 대한 품질을 결정짓는 웨이퍼 빈 맵은 그 패턴을 발견하는 게 중요하다. 그 패턴을 군집짓기 위해 제안한 방법론으로 CAE 기반 self-supervised learning 기반의 동적 군집화를 소개해 주었다. (pre-training) CAE를 기반으로 encoding 된 features를 활용해 (fine tunining) 군집화를 진행한 후 그 군집을 pseudo label로 활용해 패턴 분류가 가능한 모델을 구성하였다. 새로운 패턴에 자유로울 수 있도록 특정 군집 개수에 국한되지 않는 Dynamic clustering을 적용한 게 인상깊었다. Self-supervised의 장점을 활용하고 반도체분야 문제에 적합한 접근을 수행한 연구로 생각했다. 

[Markov kernel discriminant analysis for categorical sequence embedding]- 조윤상, 김성범(고려대학교 산업경영공학과)
범주형 변수로 구성된 sequence embedding 연구에 대해 발표했다. 유전체, 텍스트, 제조공정설비 등 다양한 분야에서 sequence 데이터 분석이 이루어지고 있는데, 매우 긴 길이의 sequence를 분석할 때 각 관측된 sequence간 길이가 서로 다른 문제에 직면한다. 주로 one hot encoding을 수행한 후 feature learning을 수행하는데 학습시간이 오래 소요된다는 점과 sequence 길이가 서로 다를 때 데이터 sparsity가 높은 점이 단점이다. 오늘 발표에서는 sequence 데이터를 Markov kernel을 활용해 유한한 상태전이확률변수 차원(finite state transition probability space) 으로 변환한 후 판별분석(Fisher's discriminant analysis) 를 활용해 범주별 차원축소를 진행한 연구를 소개했다. 실험 결과 정확도 및 시간 복잡도 면에서 우수한 성능을 확인했다.

학회발표는 내가 진행하고 있는 연구진도를 한단락 정리할 수 있는 좋은 기회로 생각한다. 발표자료를 작성하며 연구의 기여점과 장/단점을 다시금 되짚어보는 좋은 계기가 되고, 어떻게 발전시켜야 할 지 발표전날까지 생각하기 때문이다. 바쁜 대학원 일정이지만 학회발표기회가 있을 때에는 무조건 참석해야겠다고 생각했다. 학회 준비하며 생각한 future work를 잘 수행하여 좋은 연구 성과로 발전시켜야겠다.