- 2019년 11월 7일 오후 9:42
- 조회수: 480
김상훈
세계적인 Computer Vision 학회 중 하나인 ICCV가 올해는 서울 코엑스에서 2019년 10월 27일부터 11월 2일까지 일주일간 개최되었다. 나 또한 연구실에서 좋은 기회를 주어 참석할 수 있었다. 대학원 입학 후 첫 학회라 더욱 감개무량하였다.
1.
Tutorial Session에는 그나마 내가 조금 공부해보았던 Object Detection을 다룬 Visual Recognition for Images, Video, and 3D Tutorial이 가장 인상깊었다. R-CNN에서 Instance Segmentation Model까지의 발전 과정을 R-CNN 논문의 저자 Ross Girshick으로부터 설명을 들을 수 있었던 점이 특히 좋았다. 또한 Ross Girshick은 Detection 연구는 현재 적은 클래스를 가진 데이터셋으로 연구가 주로 이루어지고 있는데, 앞으로의 Detection 연구의 방향은 수천 개의 클래스를 가진 데이터를 다룰 수 있어야한다고 한다. 대가가 바라보는 Detection 연구가 나아가야 할 방향을 직접 들을 수 있어 너무 유익했다. 동시간대에 열린 Global Optimization for Geometric Understanding with Provable Guarantees Tutorial에서는 3D vision에서의 Global Optimization 문제를 다루었는데, 학부 때 공부해서 익숙한 Convex Optimization 등의 최적화 이론 개념들이 어떻게 Computer Vision 파트에 적용되는지 알 수 있었고, 다시금 기본 개념들을 정리해봐야겠다는 의지를 다지게 했다.
그리고 Poster
Session에서는 정말 다양한
연구들이 이루어지고 있다는 것을 알
수 있었다. 기존에 흔히 알고있던
알고리즘을 획기적으로 적용하는 연구들도 볼 수
있었고, 정말 상상도
못했던 주제를 연구하는 사람들을 보며 자극을
받았다.
2.
Main Conference에서는 Computer
Vision 쪽에서 GAN쪽으로 굉장히 많은 연구가
이루어졌고 여전히 이루어지고 있다는 사실을 다시금 인식할 수 있었다. 이번 ICCV의 Best
paper 또한 GAN에 관한
논문이었는데, (Best
Paper : “SinGAN:
Learning a Generative Model from a Single Natural Image”) SinGAN은 간략히
말하자면, 1장의 이미지를
가지고, GAN을 학습시키는
방법론이다. 단일 이미지로부터
internal distribution를
얻어내기 위해서
unconditional generative model을 만들어야 한다. 이를 위해
SinGAN은 multi-scale GAN 구조를
사용했다. 또한 발표
자체가 워낙 매력적이었기에, GAN에 대해 많이
알지 못하는
내게도 많은 인상을
남겼다.
총평 : 전반적인 학회의 소감은 ‘아쉬움’이다. 다름아닌, 너무나도 훌륭한 발표들을 이해하기에 내 실력이
부족했다는 아쉬움이다. Computer
Vision 쪽에 대한
공부는 1년 전 가볍게 논문 2~3편 공부해본
것이 전부인지라, 아직 Deep
Learning 전반에 대한 지식이
미천한 내게 이번 학회의
발표 내용을
따라잡는 것은 너무나도
벅찼다. 그래서 더욱 실력
향상에 대한 열정이
생긴 것
같기도 하다. 좋은 기회를
얼마나 더 가치있게
만들 수
있을지가 전적으로 내 실력에
달려있다는 생각이 번뜩 들었다.