- 2022년 7월 25일 오전 11:15
- 조회수: 6967
REFERENCES
INFORMATION
- 2022년 7월 22일
- 오후 1시 ~
온라인 비디오 시청 (YouTube)

TOPIC
On-Line Video
OVERVIEW
발표자 후기

이번 세미나는 심층 신경망 기반 open-set recognition 알고리즘들을 소개하였다. 최근 open-set recognition 연구를 수행하며 참고했던 논문들을 정리하고, 그 외 새로운 논문을 읽어보며 더 공부할 수 있는 좋은 기회였다. Open-set recognition 분야를 잘 모르는 사람들을 위해 문제 상황을 정의하고 해당 연구의 필요성을 설명한 후, 다양한 접근 방식의 알고리즘들에 대해 다루었다. 내가 이 논문들을 처음 읽었을 때 이해하기 어려웠던 부분들을 청자분들도 동일하게 어려워할 것이라고 생각해서 어떻게 쉽게 설명할 수 있을지 고민을 많이 한 것 같다. 항상 열심히 준비했다고 생각하지만 막상 완성된 세미나를 보면 조금 아쉬움이 남는데, 그래도 이번 세미나가 open-set recognition 분야를 몰랐던 분들과 이 분야에 관심이 있으신 분들에게 조금이라도 도움이 되길 바란다.
청취자 후기

이번 세미나는 딥러닝 기반의 Open-set Recognition에 대해 진행되었다. Open-set Recognition이란 학습하지 않은 Class를 탐지하는 Task를 의미한다. 기존에는 Threshold를 정해 출력된 모든 Class의 예측 확률이 Threshold보다 낮으면 Unknown으로 분류하였다. 하지만 딥러닝 기반 방법론은 특정 Class에 속하는 확률이 매우 높게 산출되는 경향이 있어서 이러한 접근은 적절하지 않다. 본 세미나에서는 이를 다르게 접근한 OpenMax, CROSR, ii-Loss 3가지 방법론을 소개한다.
먼저 OpenMax는 딥러닝 기반의 Open-set Recognition에서 가장 시초가 되는 방법론이다. 일반적인 Classification Task처럼 Cross Entropy를 기반으로 학습한 후, 잘 예측된 Instance에 대하여 각 클래스 별로 평균을 내어 대표 Feature Vector를 결정한다. 이후 잘 예측된 동일 Class의 Instance와 대표 Feature Vector 간 거리를 구해 극단 분포를 추정한 후, 이들을 통해 Feature Vector를 업데이트 하여 Class 분류 및 Unknown 탐지를 수행한다. 하지만 Cross Entropy의 경우 Known 클래스 간 분류에만 집중해서 학습하기에, Unknown 탐지에 적합하지 않을 수 있다. 이에 따라 CROSR은 Cross Entropy와 Reconstruction Error를 동시에 고려하는 방식으로 Feature Vector에 Latent Vector를 함께 활용함으로써 이를 극복할 수 있었다. 마지막으로 ii-Loss는 앞서 고려한 거리 기반 방법론이 학습에서는 고려되지 않기에 적합하지 않다는 한계를 언급한다. 이는 목적함수를 같은 Class의 Sample들은 가까워지도록 다른 Sample들은 멀어지도록 목적함수를 설정하였고, 정의한 Outlier Score를 기반으로 Unknown 탐지를 수행한다.
이번 세미나를 통해서 Open-set Recognition에 대해 처음으로 접하였지만 쉬운 설명을 기반으로 Open-set Recognition에 대한 큰 그림을 그릴 수 있었다. 사실 정말 간단한 아이디어에서 출발한 것 같지만, 현실 상황에서는 너무 당연하고 필수적인 Task라는 느낌을 받았다. 유익한 세미나를 준비해주신 오혜령 연구원님께 감사드리며 이상으로 세미나 후기를 마친다.

이번 세미나는 Open-set Recognition에 대하여 진행 되었다. 최근 Deep Learning 분류 모델이 굉장히 높은 정확도를 보여주고 있지만 학습 때 사용되지 않은 데이터가 입력될 경우 오분류를 하는 문제가 있으며 이는 굉장히 치명적인 문제를 낳을 수 있기에 모르는 것은 모르는 것으로 분류를 하는 것이 굉장히 중요하다. 본 세미나는 특히 Deep Neural Networks based Open-set Recognition Algorithms에 대하여 다루었으며 DNN에서 Open-set 인식을 처음 적용한 알고리즘인 OpenMax를 시작으로 해당 방법론을 개선한 CROSR, ii-loss를 차례로 소개해주었다. OpenMax는 학습 과정은 일반적인 DNN과 다르지 않고 학습이 끝난 뒤에 Feature Vector들의 평균과 이로부터의 거리를 계산하여 입력된 데이터가 Unknown인지 아니면 알고 있는 Class인지를 구별한다고 한다. 처음 들어보는 내용이지만 굉장히 쉽게 설명해주어 어려움 없이 이해할 수 있었다. 다음은 OpenMax를 개선한 CROSR에 대해 설명해주었는데 이는 OpenMax에 reconstruction error 개념을 추가하여 성능을 개선하였다고 한다. 기존의 OpenMax에서 계산에 사용된 Feature Vector는 Known Class 간 분류에 집중하여 만들어진 Feature이기 때문에 Unknown을 구분하는데는 적합하지 않다는 아이디어에서 출발하였다. 마지막으로 소개된 ii-loss도 OpenMax를 보완하여 제안 된 알고리즘으로 Cross-entropy로 산출된 Feature Vector가 거리 기반의 Outlier Score 산출에는 적합하지 않다고 보고 거리 개념이 반영된 손실 함수인 ii-loss를 제안하여 높은 성능을 보이는 것을 확인할 수 있었다. 최근 산업 현장에서 생성된 데이터를 분석하면서 정말 분류가 불가능한 데이터도 많다는 사실을 체감하고 있었었는데 조금이라도 성능을 높이기 위해서 애쓰는 것은 당연하지만 분류가 어렵거나 안되거나 애매한 것은 그 자체로 결과를 내는 것도 큰 의미가 있으며 이 또한 굉장히 중요하다고 생각하게 되었다. 유익한 세미나를 준비해주신 오혜령 연구원님께 감사드리며 이상으로 세미나 후기를 마친다.

Open-set Recognition 세미나를 청취하였다. Open-set Recognition은 학습해 본 적 없는 신규 특성을 가진 데이터 인식 방법론으로, 다양한 데이터들이 빠르고 많이 수집되는 빅데이터 시대에 꼭 필요한 방법론이다. 본 세미나에서는 딥러닝 기반의 Open set Recognition 방법론 3가지가 소개되어 있다. 3가지 방법론 모두 매우 직관적인 그림을 통해 아주 쉽게 설명되어 있다. 또한, 3가지 방법론 사이의 연구 흐름도(단점 소개, 단점을 보완하는 새로운 알고리즘의 특징, 단점을 극복할 수 있었던 이유)가 아주 유익하였다. 특히, 오늘 소개된 거리 기반의 새로운 데이터 인식 인싸이트들은, 제 연구(베이지안 딥러닝 모델 신뢰성)와 관련하여, 엮어볼 수 있을 것 같다는 생각이 들었다. 좋은 세미나를 준비하느라 고생 많았을 혜령이에게 감사의 말을 전하며, 세미나 후기를 마치도록 한다.