고려대학교 DMQA 연구실

2019 International Conference on Computer Vision - 김상훈

2019년 11월 7일 오후 9:42
조회수: 480

Reviewed by

김상훈

세계적인 Computer Vision 학회 중 하나인 ICCV가 올해는 서울 코엑스에서 2019년 10월 27일부터 11월 2일까지 일주일간 개최되었다. 나 또한 연구실에서 좋은 기회를 주어 참석할 수 있었다. 대학원 입학 후 첫 학회라 더욱 감개무량하였다.

Tutorial Session에는 그나마 내가 조금 공부해보았던 Object Detection을 다룬 Visual Recognition for Images, Video, and 3D Tutorial이 가장 인상깊었다. R-CNN에서 Instance Segmentation Model까지의 발전 과정을 R-CNN 논문의 저자 Ross Girshick으로부터 설명을 들을 수 있었던 점이 특히 좋았다. 또한 Ross Girshick은 Detection 연구는 현재 적은 클래스를 가진 데이터셋으로 연구가 주로 이루어지고 있는데, 앞으로의 Detection 연구의 방향은 수천 개의 클래스를 가진 데이터를 다룰 수 있어야한다고 한다. 대가가 바라보는 Detection 연구가 나아가야 할 방향을 직접 들을 수 있어 너무 유익했다. 동시간대에 열린 Global Optimization for Geometric Understanding with Provable Guarantees Tutorial에서는 3D vision에서의 Global Optimization 문제를 다루었는데, 학부 때 공부해서 익숙한 Convex Optimization 등의 최적화 이론 개념들이 어떻게 Computer Vision 파트에 적용되는지 알 수 있었고, 다시금 기본 개념들을 정리해봐야겠다는 의지를 다지게 했다.

그리고 Poster Session에서는 정말 다양한 연구들이 이루어지고 있다는 것을 알 수 있었다. 기존에 흔히 알고있던 알고리즘을 획기적으로 적용하는 연구들도 볼 수 있었고, 정말 상상도 못했던 주제를 연구하는 사람들을 보며 자극을 받았다.

Main Conference에서는 Computer Vision 쪽에서 GAN쪽으로 굉장히 많은 연구가 이루어졌고 여전히 이루어지고 있다는 사실을 다시금 인식할 수 있었다. 이번 ICCV의 Best paper 또한 GAN에 관한 논문이었는데, (Best Paper : “SinGAN: Learning a Generative Model from a Single Natural Image”) SinGAN은 간략히 말하자면, 1장의 이미지를 가지고, GAN을 학습시키는 방법론이다. 단일 이미지로부터 internal distribution를 얻어내기 위해서 unconditional generative model을 만들어야 한다. 이를 위해 SinGAN은 multi-scale GAN 구조를 사용했다. 또한 발표 자체가 워낙 매력적이었기에, GAN에 대해 많이 알지 못하는 내게도 많은 인상을 남겼다.

총평 : 전반적인 학회의 소감은 ‘아쉬움’이다. 다름아닌, 너무나도 훌륭한 발표들을 이해하기에 내 실력이 부족했다는 아쉬움이다. Computer Vision 쪽에 대한 공부는 1년 전 가볍게 논문 2~3편 공부해본 것이 전부인지라, 아직 Deep Learning 전반에 대한 지식이 미천한 내게 이번 학회의 발표 내용을 따라잡는 것은 너무나도 벅찼다. 그래서 더욱 실력 향상에 대한 열정이 생긴 것 같기도 하다. 좋은 기회를 얼마나 더 가치있게 만들 수 있을지가 전적으로 내 실력에 달려있다는 생각이 번뜩 들었다.