- 2021년 3월 5일 오후 2:49
- 조회수: 2188
INFORMATION
- 2021년 3월 5일
- 오후 1시 ~
- 온라인 비디오 시청 (YouTube)
TOPIC
On-Line Video
OVERVIEW
이번 세미나에서는 Computer vision에서 다양한 문제들을 해결하기 위해 컴퓨터가 세상을 보는 방식과 Computer vision에 적용되는 다양한 딥러닝 방법론들에 대해 전반적으로 다루고자 한다.
참고 문헌:
[1] Girshick, R. (2015). Fast r-cnn. In Proceedings of the IEEE international conference on computer vision (pp. 1440-1448).
[2] Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). Imagenet classification with deep convolutional neural networks. Advances in neural information processing systems, 25, 1097-1105.
[3] He, K., Gkioxari, G., Dollár, P., & Girshick, R. (2017). Mask r-cnn. In Proceedings of the IEEE international conference on computer vision (pp. 2961-2969).
[4] Van Oord, A., Kalchbrenner, N., & Kavukcuoglu, K. (2016, June). Pixel recurrent neural networks. In International Conference on Machine Learning (pp. 1747-1756). PMLR.
청취자 후기
금일 세미나는 진혁이 형이 딥러닝 기반 컴퓨터 비전(vision) 분야를 전반적으로 소개해주었다. 컴퓨터 비전은 기계가 사물을 인지하여 의미있는 정보를 추출하는 학문으로, 인간의 오감 중 시각이 가장 중요한만큼 활발하게 연구되고 있는 분야이다. 컴퓨터 비전 연구의 가장 기본이 되는 합성곱 인공신경망(CNN) 소개와 CNN을 기반한 8가지 컴퓨터 비전 분야 소개를 청취할 수 있었다. 평소에 비전 기반의 연구 분야가 얼마만큼 발전되어 왔는지 잘 모르고 있는 상태였는데, 8가지 각 분야별 태스크 소개와 입출력 데이터, 레이블 요소를 설명해주어 비전 분야를 전반적으로 이해해볼 수 있는 시간이였다. 발표를 들으면서 정갈하게 제작된 피피티와 명확한 핵심 전달이 많이 느껴져서, 진혁이 형이 본 세미나 준비를 위해 시간 투자를 많이 했음을 느낄 수 있었다. 또한 딥러닝에 대한 깊은 지식이 없는 사람들도 쉽게 이해할 수 있도록 신경써서 발표해주신 느낌을 많이 받아, 인공지능 대학원에 진학한 자녀를 둔 부모님들에게도 소개해주고 싶은 영상이였다! 앞으론 부모님과 친척이 너 대학원에서 뭐 공부하고 있니 물어보시면, 어물쩡 저물쩡 넘어가지 말고 본 세미나를 추천해줘야 겠다고 생각했다. 멋진 세미나를 준비해주신 진혁이 형에게 감사의 말씀을 전하며 세미나 후기를 마치도록 한다. 감사합니다~
이번 세미나는 컴퓨터 비전 분야에 딥러닝이 어떻게 적용되는지를 주제로 진행되었다. 컴퓨터 비전의 개념부터 차근차근 설명해주셔서 전반적인 컴퓨터 비전에 대해 쉽게 이해할 수 있어 좋았다.
먼저 컴퓨터비전은 입력되는 이미지에서 CNN기법을 통해 특징을 추출하고, 사물을 인지하여 정보를 얻어내는 학문이다.
컴퓨터비전 분야에서 딥러닝은 이미 다양한 방법으로 응용되고 있다. 먼저 이미지가 사전에 정의한 어떤 범주에 속하는지 분류하는 Image Classification, Bounding Box까지 생성해 어디에 존재하는지의 정보까지 예측하는 Localization에 응용되고 있다. 더 나아가서 여러가지 물체에 대한 Classification을 진행하는 Object Detection도 이루어지고 있는데, 이때 물체를 탐색하는 방법으로 Sliding window를 사용하면 모든 영역을 보기 때문에 연산량이 많아져 Regional proposal방식으로 물체가 있을 법한 영역을 찾아내도록 한다. 이미지를 단순이 Classification, Localization만 하는것이 아니라 픽셀별로 사전에 정의한 범주 중 어느 범주에 속하는지 예측하는 Sementic segmentation과 Instance Segmentation도 이루어지고 있고, 저해상도에서 고해상도 이미지로 변환하는 Image Super Resolution분야도 있다. 특히 관심이 갔던 분야는 컴퓨터비전 분야와 내가 관심을 가지고 있는 NLP분야를 융합한 연구분야였는데, 이미지 특징을 추출하고 이를 바탕으로 이미지를 설명하는 문장을 생성하는 Image Captioning, 역으로 Text분석을 통해 Text의 특징을 가지는 이미지를 생성하는 Text to Image분야는 좀 더 자세히 알아보고 싶은 생각이 들었다.
이번 세미나를 통해 컴퓨터비전분야에 흥미와 관심을 가지게 되었다. 이해하기 쉽게 컴퓨터비전에 대한 내용을 담은 세미나를 준비해주신 연구원님께 감사한 마음을 전하고 싶다.
이번 세미나는 "Applications fo Deep Learning for Computer Vision"이라는 주제로 진행되었다. 컴퓨터 비전은 딥러닝에서 가장 연구가 활발히 진행되고 있는 분야 중 하나인 만큼 다양한 task에 적용이 가능하다. 이번 세미나에서는 다양한 컴퓨터 비전에서의 다양한 task에 관해서 소개되었다. 오늘 소개된 task들은 아래와 같이 정리해볼 수 있다.
Classification: 이미지가 주어졌을 때 이미지가 사전에 정의된 범주 중 어느 범주에 속하는지에 대해 분류하는 문제
Localization: classification과 함께 이미지 내에 객체의 위치를 함께 탐지하는 task, 이미지 내에 하나의 객체만 존재한다고 가정
Object Detection: 이미지 내에 객체를 탐지하는 task, localization과 다르게 여러 개의 객체가 있는 경우도 포함
Object Segmentation: 이미지 픽셀 단위로 classification을 수행, 같은 범주 내에 객체를 구분하지 않으면 semantic segmentation, 범주 내의 객체를 구분하면 instance segmentation이라고 한다.
Image Super Resolution: 저해상도의 이미지를 고해상도로 복원하는 task
Image Synthesis: 새로운 이미지를 생성하거나 기존의 이미지를 합성하는 연구
Image Reconstruction: 손상된 이미지를 원래의 이미지로 복원하는 문제
Image Colorization: 흑백의 이미지를 색이 있는 이미지로 복원하는 연구 분야
Image Captioning: 이미지가 주어졌을 때 이미지에 적합한 문장을 생성하는 문제
Text to Image: 문장이 주어졌을 때 문장에 부합하는 이미지를 생성하는 문제
이번 세미나를 통해 컴퓨터 비전에서 수행되고 있는 다양한 연구들에 대해 살펴볼 수 있었다. 세미나를 위해 고생해준 진혁이형에게 감사의 뜻을 전한다.
Computer Vision Task 의 다양한 분야에 대해 알아보았다. Classification, Localization, Object Detection, Instance/Semantic Segmentation 등 흔히 들어본 연구 주제 뿐만 아니라 Reconstruction, Image Super Resolution, Image Synthesis, Colorization 등의 이미지 복원 계열의 application 연구 task에 대해서도 소개가 되었다는 것이다.
해당 세미나는 특정 논문을 깊게 파보거나 SOTA trend 를 알아보는 것이 아니라, 컴퓨터 비전 분야에 대한 소개나 활용을 알아보는 취지이기 때문에, 기존에 컴퓨터 비전 분야에 대해 공부해보고 싶었으나, 너무 많은 수식이나 전문성 때문에 두려워하였던 사람들이 보기에 매우 적합하다고 생각하며 흥미를 가질 수 있을 것 같다. 수식이 하나도 들어가지 않고 시각 자료 만으로 설명하여 매우 직관적이었다.
동기로 들어온 신입생들 대부분이 각자의 연구분야를 찾기 위해 몰두하고 있을 텐데, 해당 세미나를 통해 연구 분야에 대한 선택지가 넓어졌으면 좋겠다. 세미나를 준비한다고 고생하신 진혁이형께 감사의 말씀을 드린다.
이번 세미나는 Applications of Deep Learning for Computer Vision을 주제로 진행되었다. 내가 연구주제로 이제 막 연구하기 시작한 분야가 Computer vision쪽이라 관심있게 들을 수 있었다. CNN의 기초를 설명하기 위해 이미지를 구성하는 가장 기본 단위인 픽셀과 채널의 개념부터 설명해주었는데, 쉬운 예시로 실제 계산이 어떻게 진행되는지 사례를 보여줘서 쉽게 이해할 수 있었다. Computer vision의 응용분야는 너무나 다양한데, 이번 세미나에서 내용이 잘 정리된 것 같다. 가장 많이 접하는 응용분야로 Image classification, Object detection, Object segmentation이 있겠고, Image super resolution, Image synthesis, Image reconstruction, Image colorization, Image captioning, Text to image까지 정말 많은 연구분야가 있음을 다시 한 번 알게 되었다. Object detection 모델은 1-Stage detector와 2-Stage detector로 나뉠 수 있는데 1-Stage 모델은 Regional proposal과 Classification이 동시에 이루어지기 때문에 속도면에서 유리하며 최근에는 1-Stage 모델로 발전이 되고 있다고 한다. Object segmentation의 경우 Class단위로 분할하는 Semantic segmentation과 Class의 객체까지 분류하여 분할하는 Instance segmentation으로 다시 나뉠 수 있고, 이미지의 픽셀이 어느 Class에 속하는지를 예측하는 Task이다. Image super resolution이나 Reconstruction, Colorization은 이미지를 복원하는 개념의 Task로, 응용될 수 있는 문제가 많을 것 같다. Image captioning이나 Text to image는 자연어 처리와 연결된 연구 분야인데, Text to image는 특히 좀 더 흥미로웠다. 실생활에서도 어떤 특정 이미지를 검색하기 위해 키워드를 입력하여 이미지를 찾곤 하는데, Text to image 모델이 있다면 원하는 이미지를 금방 만들어낼 수 있을 것이다. 향후 Computer vision에서 또 연구주제를 찾게 된다면 이번 세미나에서 정리된 내용이 많은 도움이 될 것 같다. Computer vision의 많은 응용분야에 대해 정리하여 소개해준 박진혁 연구원에게 감사의 말을 전한다.
이번 세미나는 "Deep Learning for Computer Vision"을 주제로 진행되었다.
인간에게 시각이란 정보를 취득함에 있어 가장 중요한 기관이다. 옛 말에 몸이 100냥이면 눈이 90냥이라는 말이 있듯 시각으로 얻는 정보가 83%에 달한다고 한다. 때문에 Computer Vision이 AI 분야에서 가장 발전한 분야 중 하나로 평가 받는다.
Computer Vision은 사물을 인지하여 의미 있는 정보를 수학적 알고리즘을 통해 추출하는 학문으로, 픽셀이라는 이미지를 구성하는 가장 기본적인 단위와 RGB channel을 기준으로 이미지의 feture를 정한다. 이러한 이미지의 특징을 추출하는 대표적인 알고리즘으로 CNN(Convolutional Neural Network)이 있다. CNN은 filter를 활용하여 feature map을 얻어가는 과정이다. Feature map 개념을 통해 Image Classification, Image Localization, Object Detection, Object Segmentation, Image Super Resolution 등의 문제를 해결할 수 있다.
세미나를 통해 기존에 Classification, Detection 등 직접 필요해서 알게 된 방법론 뿐만 아니라 다양한 방법론을 알 수 있게 되어 의미 있는 시간이 되었습니다. 더불어 CV와 NLP의 경우 어떠한 연구 분야를 가지고 있더라도 언제든 활용할 수 있는 실력을 가지고 있는다면 프로젝트와 연구에서 많은 도움이 될 것이라는 생각을 하게 되었습니다.
끝으로 Computer Vision의 전반적인 부분을 이해하기 쉽도록 세미나를 준비해주신 진혁이형께 감사의 말씀을 전합니다.
이번 세미나는 'Applications of Deep Learning for Computer Vision'이라는 주제로 진행되었다. Computer Vision에 딥러닝을 적용한 여러 연구분야를 살펴보며 실제 어떠한 방식으로 적용되고 있는지를 명료하게 이해할 수 있었다.
우리는 시각으로부터 방대한 양의 정보를 얻게 된다. Computer Vision은 이러한 시각의 중요성을 기반으로 사물을 인지하여 의미있는 정보를 수학적 알고리즘을 통해 추출하는 학문이다. 해당 세미나에서는 Computer Vision 분야에서 진행되고 있는 다양한 task로 Image Classification and Localization, Object Detection, Object Segmentation, Image Super Resolution, Image Reconstruction, Image Colorization에 대해 설명해주었다. 또한, Computer Vision과 NLP를 접목하여 연구하는 분야로, 이미지를 설명하는 문장을 생성하는 연구분야인 Image Captioning과 Text를 가지고 실제 이미지와 같은 합성 이미지를 생성하는 연구분야인 Text to Image에 대해서도 소개해주었다.
Computer Vision 분야를 처음 접하는 사람들 혹은 이를 어려워했던 사람들이 이 영상을 보고 전반적 내용을 충분히 이해할 수 있을 것이라고 느낄 만큼 친절한 세미나였다고 생각이 된다. 덕분에 부담없이 시청할 수 있었고, 향후 세미나를 준비할 기회가 생긴다면 본 세미나를 참고로 하여 준비하고 싶다고 느꼈다. 열심히 세미나를 준비해주신 박진혁 연구원께 감사의 말씀을 전하고 싶다.
이번 세미나는 Computer Vision 분야에서의 여러가지 Application들을 소개하는 주제로 진행되었다. 많은 관심을 받는 시각처리 분야인 만큼 수많은 방향으로 분화되어 연구가 활발한데, 이번 세미나를 통해 각각이 어떤 특징을 가지고 있는지 이해하기 쉽게 정리된 것 같다.
CNN에서부터 classification, localization, object detection 에서는 image 내에서 어떤 방식으로 target을 포착하고 분류하는지, 또 각각 어떻게 다른지 배울 수 있었고, 나아가 각각 개체를 나누는 segmentation, 저해상도를 고해상도로 전환하는 super resolution도 흥미로운 주제였다. 그 외에도 image synthesis, reconstruction, colorization을 통해 이미지를 복구하는 분야도 있었다. text 분야와 접목하는 것을 끝으로, 이미지 처리뿐만이 아니라 다른 분야와 접목하여 사용한다면 더 넓은 분야로 확장하여 연구할 수 있겠단 생각이 들었다.
아무래도 반도체 wafer map 분야에 관심이 많은 나로서는 computer vision에 관심이 가는데, 이번 세미나를 통해 어떤 방식의 연구들이 진행되고 있는 지에 대해 폭넓게 인지할 수 있었고, 그게 앞으로 연구에 대한 방향을 잡기에 hint가 된 것 같다. 현재는 classification에 대한 방법론적인 부분을 좀더 탐색하고, 이번 세미나에서 언급된 방법들에서의 task들을 찾아보면서 좀더 보강하면 좋을것 같다는 생각이 든다. 알기 쉽고 폭넓게 이해할 수 있도록 설명해주셔서 감사하다는 말씀 전하고 싶다.
금일 세미나는 'Applications of Deep Learning for Computer Vision'의 주제로 컴퓨터 비전 분야에서의 다양한 application에 대하여 알아보았다. 우선 컴퓨터 비전이란, 사진이나 동영상 내에 있는 사물을 인지하여 의미 있는 정보를 파악하는 학문이다. Image Classification 이란 이미지가 어느 범주에 속하는지, 그리고 Image Localization은 추가로 bounding box regression을 통하여 위치까지 파악하는 문제이다. Object Detection은 여러 개의 객체를 탐지하는 localization 문제이며, 속도가 더 중요한 요즘에는 regional proposal과 classification이 동시에 이루어지는 1-Stage Detector를 주로 활용한다. Object Segmentation은 이미지 픽셀이 어느 범주에 속하는지 예측하는 문제, Image Super Resolution은 저해상도 이미지를 고해상도로 변환하는 연구이다. 이 외에도 새로운 이미지를 생성하는 Image Synthesis, Image Reconstruction, Image Colorization, 그리고 컴퓨터 비전과 NLP를 함께 활용하는 Image Captioning과 Text to Image의 여러가지 연구분야를 모두 살펴볼 수 있었다. 컴퓨터 비전이라는 분야 내에도 이렇게나 다양한 활용 분야들이 있다는 점이 흥미로웠고, 추후에 컴퓨터 비전의 구체적인 연구 분야를 선정하게 된다면 해당 세미나를 참고하는 것이 도움이 많이 될 것이라 생각되었다. 어려운 수식없이 다양한 분야에 대하여 직관적으로 이해할 수 있는 세미나였다.
이번 세미나는 computer vision 분야에 deep learning을 적용한 연구들에 대한 소개로 진행되었다. 사람이 시각을 통해 얻는 정보가 많은 것처럼 컴퓨터가 시각적인 정보를 잘 얻는다면 활용할 수 있는 분야가 굉장히 다양하다. 세미나에서 소개된 computer vision의 연구는 다음과 같다.
- Image Classification : 사전에 정의한 범주 중 객체가 어떤 범주에 속하는지 분류
- Image Localization : 단일 객체에 대해 Classification뿐만 아니라 객체가 존재하는 위치도 예측
- Object Detection : 여러 객체에 대한 Classification과 함께 위치 정보도 파악하는 Localization 수행
- Object Segmentation : 이미지 픽셀 단위로 속하는 범주를 예측
- Image Super Resolution : 저해상도 이미지를 고해상도 이미지로 변환
- Image Synthesis : 새로운 이미지를 생성하거나 기존의 이미지를 합성
- Image Reconstruction : 손상된 이미지를 원래 이미지처럼 복원
- Image Colorization : 손상된 이미지 색을 원래 이미지 색처럼 복원
- Image Captioning : 이미지를 설명하는 텍스트를 생성
- Text to Image : 주어진 텍스트에 대해 실제 이미지와 같은 합성 이미지를 생성
여러 번 들어본 개념도 있고 익숙하지 않은 용어들도 많이 있었는데 이번 세미나를 통해 computer vision의 다양한 연구 분야에 대해 전체적으로 정리할 수 있었다. 주어진 이미지에서 특정 정보를 추출하는 것뿐만 아니라 이미지 자체를 변환하는 다양한 연구가 있다는 것을 다시 한번 느낄 수 있었다. 특히 Image Synthesis는 남성의 얼굴을 여성처럼 바꾸어준다거나 성인의 얼굴을 어린 아기의 얼굴로 바꾸어주는 등 최근 SNS에서 유행하던 이미지 변환에 필요한 개념이라는 것을 생각할 수 있었다. computer vision을 처음 접하는 사람들도 쉽게 이해할 수 있도록 각 연구의 핵심적인 내용을 잘 설명해 주신 것 같다.
이번 세미나는 computer vision 분야에서의 다양한 application에 대해 진행되었다. Computer vision은 이미지에서 사물을 인지하여 정보를 추출하는 학문으로 다양한 task에서 활용할 수 있다. Computer vision분야의 대표적인 연구분야는 다음과 같다. 1) Image Classification: 이미지가 사전에 정의한 범주 중 어떤 범주에 속하는지 분류하는 문제이다. 2) Image Localization: 이미지가 사전에 정의한 범주 중 어떤 범주에 속하고 어디에 존재하는지 예측한다. 3) Object Detection: multi-labeled classification과 localization을 모두 사용한다. 연산량이 많은 Sliding window 방식은 이미지의 모든 영역을 보기 때문에 연산량이 많다는 단점이 있다. 반면 Region proposal은 이미지 내에서 물체가 있을 법한 영역을 찾아내는 방식이다. 4) Object Segmentation: 이미지 픽셀이 사전에 정의한 범주 중 어느 범주에 속하는지 예측하는 것으로 semantic segmentation과 instance segmentation이 있다. 이 외에도 5) 이미지의 해상도를 높이는 image super resolution, 6) 새로운 이미지를 생성하거나 기존 이미지를 합성하는 image synthesis, 7) 손상된 이미지를 복원하는 image reconstruction, 8) 이미지의 색을 복원하는 image colorization, 9) 이미지를 설명하는 문장을 생성하는 image captioning, 10) text를 바탕으로 이미지를 생성하는 text to image가 있다.
이해하기 쉬운 예시와 함께 설명해주셔서 computer vision의 다양한 분야를 접해볼 수 있었다. 유익한 세미나를 진행해 주신 진혁오빠에게 감사의 말씀을 전한다.
이번 세미나는 "Deep Learning for Computer Vision" 이라는 주제로 진혁이형이 발표를 했다. 주제에 맞게 세미나는 Deep Learning을 활용한 Computer Vision의 분야에 대해 소개를 해주는 방식으로 진행되었다.
Computer Vision 분야는 CNN의 발전과 함께 엄청난 성능을 보이며 발전을 해왔고 시각이라는 분야인 만큼 다양하게 적용되어 왔다. 가장 기본적인 Classification 문제부터 Object Detection, Segmentation 등 이미지의 물체의 위치와 개수를 찾는 문제, 저해상도 이미지를 고해상도 이미지로 변환시키는 Image Reconstruction, 그리고 텍스트와 연관된 Image Captioning, Text to Image 등이 모두 Computer Vision 분야이다.
이번 세미나에서는 각 분야에 대해서 깊이 들어가 설명하는 것이 아닌 신입생들을 위해 기본적이고 중요한 개념들을 그림으로 쉽게 설명해 주었다. 각 분야에 대해 간결하면서도 중요한 부분을 잘 설명해준 진혁이형에게 감사드리며 세미나 후기를 마친다.
이번 세미나는 진혁이가 컴퓨터 비전 분야 딥러닝에 대해 알려주었다.
컴퓨터 비전은 사물을 인지해서 의미 있는 정보를 추출하는 지도학습의 한 분야이고, 사진/동영상을 활용한다.
이미지는 RGB의 3개의 채널로 구성되어 있고, 특징을 추출하기 위해 Feature Map이 필요하다.
Feature를 만들기 위해서는 이미지의 특징을 추출하는 CNN(Convolutional neural network) 이라는 알고리즘을 사용한다.
이미지 픽셀을 실수로 표현하고, Filter (이미지 특징을 찾아 내기 위한 파라미터)를 이용해 합성곱 하면 Feature Map을 얻을 수 있다.
이 Vector를 활용해서 Class 중 가장 높은 확률을 찾으면 분류 문제이고, 추가로 Bounding Box Regression을 추가로 진행하면 Localization이 된다.
또, 여러 객체에 대해 Classification + Bounding Box Regression 을 진행하면 객체 탐지 문제가 된다.
Object segmentation은 이미지 각 픽셀이 사전에 정의한 범주중에 어느 범주에 속하는지 픽셀별로 분류하는 문제이다.
이 외에도 컴퓨터 비전을 활용해서 이미지를 복원, 생성, 합성 등 다양한 분야에서 활용할 수 있다.
또한 이미지를 문장으로 설명하거나, 텍스트를 통해 이미지를 생성하는 것도 가능하다.
컴퓨터 비전과 딥러닝 관련 용어조차 생소한 나에게는 컴퓨터 비전과 딥러닝의 개념에 대해 알 수 있었고,어떻게 활용 할 수 있는지 적절한 예시로 알 수 있어 유익한 시간이었다.
컴퓨터 비전에 대해 세미나를 준비해 준 진혁이에게 감사의 뜻을 표한다.
컴퓨터비전 연구 분야를 전체적으로 훑어볼 수 있는 세미나였다. 시각의 중요성부터 시작해 아주 기초적인 부분부터 차근차근 설명해줘서 그동안 공부했던 것들을 정리할 수 있어 좋았다. 특히, Object detection과 segmentation은 지난번 용원이가 세미나에서 설명해준 Human Pose Estimation이나 나의 개인연구 분야인 Scene text detection 등 여러 분야로 응용될 수 있다는 생각이 들어 더 관심 있게 들었다. 또한 저해상도 이미지를 고해상도로 변환하는 Super Resolution, 흑백 이미지를 컬러로 변환하는 Image Colorization에 관한 내용도 이번 학기 연구원들과 시작하려는 과제에 큰 도움이 될 것 같다. 세미나를 위해 많은 준비를 해 준 진혁이에게 감사 인사를 전한다.