- 2019년 11월 12일 오후 11:34
- 조회수: 370
강현규
[학회후기]
서울대학교 관악캠퍼스에서 개최된 2019 대한산업공학회 추계학술대회에 참가하였다. 작년 데이터마이닝 학회 이후 1년만의 서울대 방문이였다. 그 당시에는 연구실 생활을 시작한지 얼마 되지 않아서 아는 것도 없을 뿐더러 사람들과 어색했을 때여서 하루 종일 학회에서 발표 듣기가 참 힘들었는데(?) 어느 새 1년이 훌쩍 지나 발표를 하러 와서 나름 뿌듯하기도 하고 감격스럽기도 했다. 이번 학술대회는 연구실 생활 1년만에 처음으로 발표자로 참가한 학회여서 그런지 준비를 많이 했음에도 긴장이 많이 되었고, 석사경진대회 참가의 부담감도 좀 있었다. 오전 세션에는 석사경진대회에 참가하여 논문 발표에 대한 심사를 받고, 다른 본선 진출자들의 발표를 들었다. 최단경로 찾기와 같은 최적화 관련 연구들이 주를 이뤘으며 이미지에 대한 딥러닝 응용 연구들도 있었다. 전체적으로 연구 내용들이 흥미로로웠다. 텍스트 관련 발표는 혼자였고 텍스트가 다른 산업공학 분야의 연구들과 좀 떨어져 보여서 어떻게 하면 관심을 잘 끌 수 있을까 발표 순서를 기다리면서 고민을 했던 것 같다. 오후 세션에는 같은 연구실 선배들의 발표와 관심있는 분야의 연구들을 찾아서 들었다. 연구실 선배들의 발표를 들으며 나는 아직 갈 길이 멀었구나 하는 생각이 들었고, 다른 연구실에서 진행하는 발표를 들으며 다방면으로 관심을 갖고 앞으로 연구를 해야겠다는 생각을 했다. 마지막으로 교수님의 지도와 많은 연구실 선후배동료들의 도움 덕분에 기대하지 않은 상을 수상할 수 있었다. 처음 논문을 쓸 때는 '이런게 무슨 논문이 돼?' 라는 의구심을 스스로 갖고 있었기 떄문에 논문과 PPT를 작성하고 발표하는 데 애를 먹었는데 격려와 도움 덕에 연구를 잘 발전시켜 논문을 쓸 수 있었다. 이 글을 빌어 다시 한번 교수님과 연구원들에게 감사하다는 말을 전합니다.
[발표후기]
호텔/리조트와 같은 서비스 산업에서 고객들이 온라인 채널을 통해 남기는 VOC를 분석하는 일은 기업 경영에 있어 매우 중요하다. 정보통신기술이 발달한 요즘 다양한 채널에서 실시간으로 대량의 VOC가 수집되므로 이를 담당자가 하나하나 확인하여 불만성을 확인하는 것은 어려운 일이므로 감성분석을 수행하는 모델을 구축하여 이를 대체하려는 시도들이 늘어나고 있다. 하지만 채널별로 타겟의 종류가 상이하며, 문장 길이, 주로 언급되는 내용 등 채널별 특성이 상이하다. 따라서 채널별 특성을 반영하여 하나의 모델로 두개의 감성분석 태스크를 동시에 처리하는 Multitask RNN 모델을 제안하였다. 제안 모델은 Bidirectional GRU + Attention Mechanism의 파라미터들을 공유함으로서 두 채널의 학습을 서로 상호 보완적으로 할 수 있도록 설계되었다. 제안 모델은 각 채널의 데이터로만 학습한 싱글 모델보다 우수한 분류 성능을 보였으며 특히 불만성 감성 클래스의 VOC를 잘 분류해내어 불만성 VOC의 탐지가 중요한 산업 특성 상 더 적합함을 보였다.
Q. 단순히 약간의 분류 성능만을 향상시킨 것 말고도 제안 방법론의 어떤 장점이 있는가?
A. 10개의 채널이 있다고 가정했을 때 기업 운영 측면에서 모델 10개를 구축하고 관리하는 것은 쉬운 일이 아니다. 따라서 이를 반으로만 줄여도 운영 및 관리 측면에서 효율적일 수 있다. 또한 3개~4개 이상의 태스크를 수행할 수 있는 구조로 확장시켜볼 수 도 있다. 또한 특정 채널의 데이터가 매우 불균형하다던지, 부족한 상황에서는 학습이 잘 되지 않는다. 불균형한 경우 한 클래스로 몰아 예측이 되는 경우가 생기며, 데이터 수가 절대적으로 부족하다면 모델이 학습 자체를 잘 하지 못한다. 이러한 문제상황을 해결하는데 제안 방법론이 도움이 될 수 있다.
[청취후기]
Missing Value Imputation with Adversarial Autoencoder - 고려대학교 강현구
연구실 선배 현구의 Imputation 관련 발표였다. GAN을 Imputation에 적용한 유명한 모델인 GAIN의 문제점과 성능을 향상시키기 위해 Adversarial Autoencoder의 구조를 이에 적용하였다. 먼저 Generator의 구조를 Autoencoder 구조로 변형하였고, Discriminator의 구조를 imputed value와 real value를 구별하는 Discriminator와 latent space가 사전에 정의한 분포를 따를 수 있도록 강제시키는 Discriminator의 2가지로 구성하여 모델을 학습시킨다. UCI 데이터셋에 대한 실험을 통해 다른 baseline model보다 성능이 우수함을 증명하였다. 이전에 지윤이가 연구실 세미나에서 GAIN에 대한 세미나를 했을 때 '어떻게 저런 아이디어를 생각해서 Imputation에 적용을 하지?'라는 생각을 하면서 놀라워 했던 기억이 있다. 이번에 현구 발표를 들으며 GAN 자체가 갖는 학습이 불안정하다는 문제점에 주목하여 이를 개선시키기 위해 Adversarial AE의 구조를 이에 적용하여 해결하려고 했다는 생각을 했다는 것이 흥미로웠다. 현구의 PPT가 깔끔하고 발표를 워낙 잘해서 그런지 연구 아이디어에 대한 이해도 잘 되었다. 이런 점을 본받고 싶다는 생각이 들었다. 다만 latent space의 prior을 어떻게 정하는 것이 best일지에 대해서는 궁금한 점으로 남았다.
Explainable wafer bin map classification via hierarchical feedforward attention networks - 고려대학교 이창현
문서 분류에 적용된 Hierarchical Attention Network(HAN)를 반도체 wafer bin map을 분류하는 문제 상황에 적용한 연구였다. 반도체 품질 검증 과정에서 불량 다이를 분류하기 위해서는 여러 번의 테스트를 진행한다. 불량 다이의 위치를 문장 내 단어에 대응시키고, 테스트 과정을 문서 내 문장에 대응시켜 아이디어를 모델로 구현하였다. HAN 모델이 갖는 강점은 word attention score과 sentence attention score을 통해 분류에 중요하게 작용하는 word와 sentence를 찾아낼 수 있다는 점인데 반도체 검증 프로세스에 적용하여 불량 다이의 위치와 테스트 공정을 찾아낼 수 있다는 측면에서 매우 가치있는 application 연구라는 생각이 들었다. HAN을 주제로 연구실 세미나를 진행했던 적이 있었는데, 이러한 계층적 어텐션 구조를 문서 분류 뿐만 아니라 여기저기 적용할 수 있을 것으로 생각했었는데 창현이형이 딱 필요한 문제상황에 적용해서 멋진 연구를 하신 것 같다. 나도 HAN을 커스터마이징하여 다른 필드에 적용해보려는 계획을 갖고 있는데 빨리 해봐야겠다는 생각을 했다. 그리고 창현이형의 발표에서 가장 좋았던 점은 PPT의 퀄리티가 남달랐다는 점이다. PPT만 봐도 발표자가 이 장표에서 무엇을 이야기하고 싶은지 알 수 있고, 매끄럽게 발표를 진행하기 위해 적절한 애니메이션을 사용하였다. 창현이형의 발표 실력과 PPT 구성에 대해서 많이 본받아야겠다는 생각이 들었다.