- 2019년 11월 11일 오전 9:22
- 조회수: 389
백승호
2019년 10월 27일부터 11월 2일까지 일주일간 서울 코엑스에서 개최된 2019 ICCV (International Conference on Computer Vision) 학회를 다녀왔다. ICCV는 Computer Vision 분야 최고 수준의 학회로 세계 최고 수준의 연구를 한자리에서 보고 배우며, 트렌드까지 알아볼 수 있다. 올해는 한국에서 개최되어 참석할 수 있게 되었다는 기대감에 시작 전부터 들뜬 마음으로 참석하게 되었다. 이런 학회에 참석할 수 있도록 기회를 주신 교수님께 감사한 마음이 들었고, 많이 배우고 느끼고 돌아가겠다고 다짐했다. 하지만 기쁨과 기대감은 잠시였을 뿐 이내 절망 속으로 빠져들게 되었다. 1학기에 참석했던 BI Conference 이후 처음 참석한 학회는 놀라움의 연속이었다. 엄청나게 많은 참석자와 외국인 연구자, 쉴새 없이 발표되는 Oral Presentation 그리고 수많은 포스터와 그 앞에서 기술에 대해 영어로 자연스럽게 토론하고 있는 각국의 연구자들까지 넘쳐나는 정보 앞에서 한동안 정신이 아찔해졌다. 멍한 잠시 마음을 가다듬고, 출입증 등록증과 같이 받은 안내 책자를 훑어보며 다시 학회 안으로 파고 들었다.
1. Everybody Dance Now
딱딱하기 않고 직관적인 제목과 많은 재미있는 사진으로 시선을 끄는 포스터가 있었다. 포스터를 발견하자 마자 어떤 내용일까 하는 궁금증이 밀려왔고 내용을 확인하게 되었다. 해당 연구는 사람의 모션에서 움직임을 파악하고 다른 사람에게 그 모션을 카피하는 연구였다. 연구 실험은 실제 가수들의 춤추는 포즈를 연구자 본인들과 합성하여서 더욱 흥미가 느껴진 연구였다. 포즈 탐지기를 사용하여 소스 비디오에서 포즈를 탐지하고 모션 스틱 그림을 만들어 매칭 시켰다. 그리고 동일하게 카피할 본인들의 모션을 탐지하고 모션 스틱을 만들어 두 모델을 GAN을 통해 합성하였다. 한가지 독특했던 점은 우리가 사람을 인지하는데 가장 중요하게 보는 부분이 얼굴이라는 것이다. 해당 연구는 움직임 외 얼굴만을 더욱 자세하게 지연하고자 Face GAN을 통해 원래 얼굴에 추가시키는 방법으로 자연스럽게 모션 카피를 완성해냈다. 연구 내용을 보며, 예전 첩보 영화들에 등장했던 보안 프로그램 중 주인공의 걸음걸이를 이용해 침입자를 인식하는 장면이 생각나며 해당 연구의 어플리케이션이 무궁무진 하겠다 라는 생각이 들었다.
2. Joint Monocular 3D Vehicle Detection and
Tracking
해당 연구는 2D 정보의 조합으로부터 3차원 정보를 생성하여 자율주행에 필요한 도로의 상황을 입체적으로 추정하는 방법을 제안하고 있다. 처음에는 단순히 여러 개의 센서를 통해 입체적으로 제안하는 방법론을 제안하겠구나 하고 생각하면서 보았었는데
제안하는 방법은 오히려 주위의 사물이 다른 사물에 의해 가려지는 사각 현상을 해결하는 방안을 제시하고 있었다. 이는
분명 운전자가 편하기 위해 사용하는 자율주행기술이 아닌 사고를 예방하기 위해 도로 상황을 하늘에서 보는 전지적 시점을 제안하고 있었다. 해당 논문을 보면서 우리가 왜 연구를 해야하고, 어떤 연구를 해야
보다 임팩트가 있고 실제 가치가 있는 연구가 될 수 있을지 생각하게 되었다.
이번
ICCV 학회는 정말 많은 것을 깨우쳐준 소중한 학회였다. 수많은
연구 내용도 내용이었지만, 많이 부족한 나 자신을 되돌아 보고 채찍질을 하게 되는 학회였다. 글로벌 세상에서 영어를 못한다는 것은 동물이나 다름 없었다. 수많은
연구가 있었지만, 모두 소화하지 못했다는 죄책감과 함께 앞으로 계속 도태되지 않고 당당하게 이 연구자들과
경쟁하려면 언어는 정말 기본중의 기본이겠구나 라는 경각심이 생겼다. 다음 IFORS학회에서는 당당한 학회의 한 구성원이 될 수 있도록 노력해야겠다.