고려대학교 DMQA 연구실

2019 International Conference on Computer Vision - 목충협

2019년 11월 11일 오전 10:44
조회수: 598

Reviewed by

목충협

이번년도에 iccv가 코엑스에서 10월 27일부터 일주일 간 진행되었다. 대학원에 입학하고 간 첫 국제 학회였으며 세계적으로 유명했기 때문에 신청할 때부터 매우 기대가 되었다. 또한 연구실 사람들과 같이 참석하는 기회였기 때문에 더 좋았다.

대학원에 입학한 후 여러 국내 학회들에 참여하였지만, 이번 학회는 규모부터가 매우 달랐다. 학회장의 규모 뿐만 아니라 발표와 포스터의 개수부터가 매우 많았다. 이렇게 많은 연구들이 computer vision이라는 분야에서 진행되고 있다는 것이 매우 놀라웠다.

Best paper award - SinGAN: Learning a Generative Model from a Single Natural Image

사실 평소에 computer vision 분야에서 최신 논문들을 찾아보았던 것은 아니라 어떤 것을 보아야 할지 고민이 많았다. 그래서 우선 상을 수상한 논문을 보았다.

GAN의 경우 학부 시절 프로젝트로 pix2pix 모델을 구현하였을 때 여러 모델들을 찾아봤던 기억이 있다. 당시 cycleGAN과 pix2pix 모델을 고민하던 중에 pix2pix를 선택하여 구현했다. 구현 할 때 적은 양의 데이터만으로 GAN을 학습시키려고 많이 노력했지만 만족할 만한 수준이 되지 못하였다. 이러한 GAN의 문제점은 널리 알려져 있으며, 마찬가지로 이 문제점을 해결하려는 연구들이 많이 있었다. 이 연구도 마찬가지로 적은 양(1개)의 이미지로 GAN을 잘 학습시키려는 목적을 갖고 있다. 하나의 이미지를 noise와 down-sampling을 이용하여 GAN을 학습시켰으며 결과적으로 GAN의 학습이 잘 되었다는 것을 보여주었다. 또한 이 연구를 이용하여 고화질로 바꾸거나 그림을 선명한 사진으로 바꾸는 여러 응용 결과들도 많이 있어서 매우 흥미로웠다. 기존의 style transfer와는 다르게 선명하고 자연스러운 결과를 보여 주었다.

이미지에서 나타나는 여러 문제점 중 하나가 사람이 인식하는 이미지의 유사도와 모델이 인식하는 사진의 유사도가 다르다는 것이다. 결국 이 두 가지가 같아지면 모델은 사람보다 훨씬 더 원하는 방향의 이미지를 만들어 낼 수 있을 것이다.

CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features

이 발표가 기억에 남았던 이유는 단순한 아이디어로 좋은 결과가 나왔다고 생각되었기 때문이다. 또한 네이버에서 발표한 논문이었다. 아이디어는 기존의 사진에서 다른 사진을 붙여서 학습시키는 것이다. 예를 들어 강아지 사진에서 강아지 얼굴 부분을 고양이 얼굴 사진으로 대체하여 학습시키는 것이다. 그에 따라 label도 개 0.6, 고양이 0.4로 학습하게 된다. 이런 단순한 작업으로 모델의 성능을 향상시켰다. 발표를 듣고 난 후에 왜 이런 생각을 못했을까? 라는 생각을 하게 되는 발표였다. 확실히 간단하지만 효과적인 아이디어는 기억에 잘 남는 것 같다.

사실 국제 학회는 처음이라 영어 발표가 익숙하지는 않았다. 신기하게도 한국인이 하는 영어는 매우 잘 들렸으며 비영어권 사람들의 발표는 조금 듣기 어려웠다. 다만 포스터와 발표 자료 등을 통해 어느 정도 아이디어를 이해할 수 있었다. 첫날에는 조금 힘들었지만 시간이 지날수록 더 편하게 영어 발표들을 들을 수 있게 된 것 같다. 또한 이번 학회는 결과가 시각적으로 보여지는 연구들이 많았기 때문에 조금 더 흥미롭게 들을 수 있었던 것 같다. 또한 다시 느끼는 거지만 사람들이 computer vision에 대한 관심이 엄청나다는 것을 알 수 있었던 학회였다.