고려대학교 DMQA 연구실

2019 BI conference - 민대홍

2019년 4월 15일 오전 9:51
조회수: 463

Reviewed by

민대홍

예전에도 코엑스에 여러번 들려본 적이 있었지만, 학술 목적으로 방문한
것은 이번이 처음이어서 감회가 새로웠다. 학술대회에서 발표하는 선배들의 모습 그리고 Q&A 시간의 날카로운 공방을 보며, 한 분야의 전문가로서
인정 받기 위해서는 이전에 상상하던 것 이상의 노력이 필요할 것 같다는 생각이 들었다. 수많은 기존
연구는 무엇이 있었는지 빠짐없이 검토하는 것, 쟁쟁한 아이디어 사이에서 차별성을 갖는 연구 주제를 잡는
것, 짧은 시간 안에 전문가들 앞에서 내 연구를 전달하는 것 등 이 모두 학문을 업으로 삼는 사람으로써
마땅히 기본으로 갖추어야 할 덕목일텐데, 앞으로 이 모두 전문적인 수준으로 트레이닝을 할 것을 생각하니
설렘 반, 두려움 반으로 가슴이 두근거렸다. 앞으로 몸을
담게 될 분야에서의 연구는 어떤 흐름으로 진행되는지 조금이나마 엿볼 수 있었어서 첫 발을 내딛는 내게 좋은 자극이 된 하루였다. 나아가 아는 만큼 보인다고 하는데, 다음번 학회에 갈 때에는 더 많이 들을 수 있는 준비가 되어있었으면 한다.

GASNet: Generation and Segmentation
Networks for Identifying Wafer Defect Patterns / 고려대학교 산업경영공학과 / 이창현, 김성범

생산된 웨이퍼 내 불량 다이의 발생 원인을 추적하기 위하여 발생 정도와 빈도를 정확하게 판단하는 것이 중요하다고
한다. 그래서 Wafer Bin Map에 표시된 불량 다이의
패턴검출하는 작업이 필요한데, 문제는 이 과정을 사람이 수작업으로 하는 것은 굉장히 오래 걸리기 떄문에
이 과정을 자동화하는 모델을 만들려고 한다. 하지만 모델의 학습을 위해서는 충분한 데이터가 확보되어야
하는데, 이를 위해 VAE가 인코딩, 디코딩하는 과정에서 학습한 실제 데이터의 데이터 분포(생성 모델
자체)를 학습 데이터로 이용하고자 한다. 기존 연구에도 부족한
학습 데이터를 충당하기 위해 데이터를 생성해었지만, 이때 생성된 데이터는 1 data = 1 point로서, 이번 연구에서 제안된 분포형태의
데이터;1 data = 1 probability distribution 보다 오버피팅되는 경향이 있었으며
정확도 측면에서도 GASNet의 성능이 뛰어났다. 많은 머신러닝
모델들이 데이터가 많고 다양할 수록 성능이 좋아진다는 것을 감안하면, 학습데이터가 부족한 환경에서 VAE 같은 Generator 모델의 쓰임이 무궁무진해보인다.

Class Description Network / 고려대학교 산업경영공학과, 동국대학교 산업시스템공학과 / 도형록, 김성범, 손영두

학습되지 않은 새 데이터를 ‘unseen’ 클라스로 가려내는 정직한
신경망 분류기를 제안하였다. 기존에도 original space에서 feature space로 변환하여 데이터 분류를 용이하게 만드는 기법들이 있었는데, 본 연구에서는 변환된 hypersphere들이 서로 겹치지 않도록
강제하도록 loss function을 설계함으로써 보다 명확한 분류가 가능한 것 같다. 각 군들이 compact하게 촘촘히 모여있게 하기 위해 각 hypersphere의 반지름과 각 점들이 원래 클래스 중심과의 거리인
description loss를 최소화 시켰으며, 서로 겹치지 않게 하기 위해서 서로 다른
클래스 중심과의 거리는 최대화하였다. 본 발표에서는 2가지
클래스와 1개의 미관측 클래스에 대한 분류로서 loss
function 식을 눈으로 따라갈 수 있었는데, 만약
N개의 multi-class가 된다면 loss
function의 exclusion loss 항으로 인해 계산복잡도가 O(N^2)이 될 것 같아, 향후
multi-class에 대한 연구가 더 진행될 것으로 기대된다. 또한 무엇보다 다른 발표들은
현장 문제를 푸는 내용이 많았는데, 본 연구에서는 보다 이론적인 부분을 소개해주어 BI 분야에서도 알고리즘적인 측면으로 접근할 수도 있다는 것이 고무적이었다.

합성곱 순환 신경망을 활용한 태풍의 최대풍속 산출 / 고려대학교 산업경영공학과, 국가기상위성센터 / 이민형, 이수봉, 이정환, 한성원

본 연구에서는 태풍의 이미지뿐만 아니라 당시 시간 정보를 함께 고려하는 합성곱 순환 신경망 예측 모델을 제안하였다. 이미지 정보만으로만 예측하는 모델의 정확도(;RMSE)와 비교하면 RMSE가 최대 1.5knot 줄어들었는데, 시간 정보를 추가하여 모델이 복잡해진 것에 비해 효과는 그리 크지 않은 것으로 보여 아쉬웠지만 고차원 시계열
데이터로서 접근을 했다는 점이 신선했다. 그리고 실험결과에서 보면 지평선에 가까운 태풍일수록 태풍 모양이
지구의 곡면 때문에 일그러져 예측 정확도가 떨어지는 현상이 있었는데, 데이터가 더 많았더라면 이 부분까지
신경망 모형이 이 부분까지 일반화할 수 있지 않을까 라는 생각이 든다. 다른 방법으로 위성이 정지위성인
만큼, 지면과의 기하학적인 위치 관계(f)를 계산해내어 모든
태풍의 이미지를 동일 스케일로 맞추는 전처리 방식도 고려해볼 수 있을 것 같다. 이때 이미지를 굽히고
피는 과정에서 발생하는 왜곡은 인근 픽셀 사이를 f를 기준으로 보간한다면 왜곡으로 인한 데이터 오염을
줄일 수 있을 것 같다.

Conference