[학회후기]

작년 연구실 인턴 생활을 하였을 때는 선배들의 발표만 듣던 청취자로써, 올해는 내가 진행하였던 연구를 발표하는 발표자로써 학회에 참가하였다.

확실히 첫 발표라는 무게감 때문에 작년과 올해 학회가 새삼 다르게 느껴졌다. 작년에는 다른 사람들이 어떠한 연구를 진행하여 결과를 내었는지 재미있게 듣는 가벼운 느낌이었지만,  올해는 나의 연구를 다른 사람들에게 소개하는 과정에서 많은 긴장감을 느껴 준비한 것 전부를 보여주지 못해 아쉬웠고, 내가 연구 과정에서 놓쳤던 부분을 깨닫게 된 조금은 무거운 자리였다.  아쉬웠던 시간이었지만 올해를 거름삼아 내년엔 더욱 의미있는 연구를 진행하여 다른 사람들에게 소개해주고 싶다.

오후 기조 강연으로 메타버스에 대한 강연을 인상깊게 들었다. 메타버스라는 단어는 최근에 많이 들어보긴 하였으나, 구체적인 정의나 어떤 의의를 가지고 있는지 알지 못했다. 강원대학교 김상균 교수님의 강연을 통해 메타버스가 무엇인지, 왜 중요한지를 듣고 흥미를 가지게 되었다.


[발표후기]

이번 학회에서는 제조업 설계 데이터에서 입력 변수가 결측이 존재하는 상황에서도 강건하게 모델을 학습할 수 있는 자가지도학습 방법론에 대해 발표를 하였다. 기존의 입력 변수 결측 상황에서는 대부분 최빈값, 평균, 중앙값 등의 통계량으로 대체하거나 결측 대체 모델을 별도로 구축한다. 이러한 결측 대체 모델은 데이터의 매니폴드를 충분히 학습했음에도 불구하고, 예측 모델링 프로세스에서는 사용되지 않는다. 따라서 결측이 존재하는 입력변수에서 좋은 표현력을 가지도록 선행학습을 시킨 후, 풀고자하는 태스크에 맞게 미세조정학습을 진행하는 프레임워크를 제안하였다. 제안방법론의 모티베이션은 이미지 도메인의 자가지도학습인 DINO 로써, 지역적인 정보에서 특징 추출한 표현 벡터가 전역적인 정보에서 특징 추출한 표현 벡터를 따라가도록 학습하는 것이다. 아쉽게도 많은 실험은 진행하지 못하였지만, 그래도 세션 좌장을 맡아주셨던 한국산업기술대학교 강지훈 교수님과 연구실 선배이신 김상훈 연구원께서 제안 방법론에 대한 좋은 피드백을 남겨주셨다. 내가 발표한 제안 방법론은 특정한 데이터가 내포하고 있는 고유의 결측 비율을 고려하지 않았다는 것이다. 입력 변수마다 데이터를 확보할 수 있는 난이도가 다르기 때문에, 데이터의 특징을 고려하지 않고 무작위 랜덤 마스킹을 하는 것보다는 각 변수마다 결측 비율을 고려하여 실험을 진행하는 것이 어떻겠냐는 것이었다. 해당 피드백을 통해 현재 진행중인 연구에 대한 프로세스를 다시 한번 검토해볼 수 있는 좋은 기회였던 것 같다.


[청취후기]

생산 공정의 오정보 데이터에 대한 딥러닝 모델 학습 전략(김상훈)

해당 연구는 클래스 불균형 문제와 레이블 노이즈 문제를 동시에 푸는 방법론을 제안하였다. 기존에는 클래스 불균형을 해결하기 위해 오버 샘플링이나 클래스가 가중치가 들어간 손실 함수를 사용하였다. 하지만 생산 공정의 고장을 분류하는 문제는 이러한 클래스 불균형 뿐만 아니라 실제로 고장이라고 판단한 시간 직전의 정상이라고 판단되었던 시간도 고장으로 보는 것이 맞다는 것이 연구의 가정이었다. 이러한 상황을 '레이블 노이즈' 라고 정의하는데,  이 두 가지 문제가 혼재하는 상황은 상당히 해결하기 힘들다. 클래스 불균형 상황을 풀기 위해서는 손실 함수 값이 큰 데이터를 중요하게 반영해야하지만, 레이블 노이즈가 있는 데이터는 손실 함수 값이 큰 데이터를 적게 반영해야하기 때문에 두 문제가 서로 상충하기 때문이다. 해당 방법론은 이 두 문제가 혼재하는 상황을 잘 해결하였으며, 실제 실험 결과에서도 한가지 문제만 해결한 기존 방법론들과 대등 혹은 그 이상의 성능을 나타내었다. 상충되는 두 개의 문제를 해결하는 프레임워크를 고안하기란 쉽지 않은 만큼, 해당 발표가 상당히 인상적이었다.


Domain Adaptation 을 활용한 오래된 이미지 복원(조한샘)

역사 사료 등 오래된 흑백 이미지를 생동감있게 복원할 수 있도록 딥러닝을 적용한 연구이다. 이미지 기반의 자가지도학습인 Colorful Image Colorization 과 유사하지만, 해당 연구는 채색에 대한 손상 뿐만 아니라, 기타 여러 noise 가 혼재된 mixed degradation 상황을 가정하였다. Domain Adapation 을 적용하기 위한 Domain gap 을 두 가지로 나누었는데, 하나는 이미지의 대상이 다른 Content Gap, 다른 하나는 두 이미지의 degradation(color jitter, blur etc) 가 다른 style gap 이다. 오래된 이미지를 복원하는 것이 기존의 Colorization 과 무엇이 다른지 큰 차이점을 몰랐으나, 해당 연구를 토대로 이미지 복원 연구의 다양한 문제 상황과 차이점을 알 수 있어서 재밌었다.