2024 한국데이터마이닝학회 춘계학술대회 - 조한샘
- 2024년 5월 31일 오후 4:58
- 조회수: 493
Reviewed by
조한샘

[학회 후기]
매년 연구실에서 발표자들 위주로 소수만 참가하는 데이터마이닝 학회를 이번에는 연구실 전체 인원이 모두 참석했다. 이번 학회는 연구 주제 또한 다양하고 심도 있게 다루어졌다. 특히, 이미지 처리, 자연어 처리, 강화 학습, 헬스케어 데이터 분석 등 여러 분야에서 최신 연구 동향을 확인할 수 있는 좋은 기회였다. 이번 학회를 통해 얻은 다양한 지식과 아이디어는 앞으로의 연구에 큰 도움이 될 것으로 생각된다. 발표된 여러 연구들이 실질적인 문제 해결에 어떻게 적용될 수 있는지를 보면서, 데이터 마이닝과 인공지능 기술의 무한한 가능성을 다시 한 번 느낄 수 있는 소중한 시간이었다.
[청취 후기]
1. 마스킹 기반 지도 학습을 활용한 RGB-D 중요 물체 검출
해당 연구는 RGB-D 이미지를 활용하여 주요 물체를 검출하는 새로운 마스킹 기반 지도 학습 기법을 소개했다. Salient Object Detection(SOD)이라는 주제를 중심으로, 깊이 정보와 RGB 정보를 결합하여 이미지 내에서 중요한 물체를 더 정확하게 인식할 수 있는 방법을 제안했다. 특히, 샴 구조의 네트워크를 활용하여 깊이 정보와 색상 정보를 효과적으로 통합하는 방식이 흥미로웠습니다.
2. TA-Net: Tri-Aspect Network for Camouflaged Object Detection
이 연구는 위장된 물체를 식별하기 위한 새로운 접근 방식을 제시하였으며, 세 가지 시각적 특성(경계, 색상, 질감)에 특화된 네트워크를 사용한 방법론이 돋보였다. 이번 발표에서는 위장된 물체 검출(Camouflaged Object Detection)의 어려움을 극복하기 위해 Tri-Aspect Network를 활용한 새로운 기법을 소개했다. 일반적인 Segmentation 모델들은 위장된 물체를 잘 검출하지 못하는 경우가 많지만, TA-Net은 경계, 색상, 질감 정보를 통합하여 더 정확한 검출을 가능하게 합니다. 특히, 경계 특징을 강화하기 위해 Erosion kernel을 적용하고, Sobel 필터를 활용한 Edge Network, 그리고 RGB에서 HSV로 변환하여 색상 차이를 더 두드러지게 한 Color Network 등이 인상적이었다. 실험 결과를 통해 제안된 모델이 기존의 COD 방법들보다 우수한 성능을 보였다는 점을 강조했으며 특히, 정밀한 경계 검출과 다중 스케일 피처의 결합이 모델의 성능 향상에 크게 기여한 점이 흥미로웠다.
3. 포즈 인식 디퓨전 모델을 통한 가상 의상 착용
이 연구는 이미지 기반 가상 의상 착용(Virtual Try-ON, VTON)을 목표로 하여, 디퓨전 모델을 활용한 새로운 접근 방식을 제시했다. 발표 내용에 따르면, 기존의 가상 의상 착용 시스템은 이미지의 현실성과 정확성을 향상시키기 위해 많은 도전 과제를 안고 있었다. 연구진은 이러한 문제를 해결하기 위해 포즈 인식 기반 디퓨전 모델을 사용하여, 다양한 각도와 자세에서의 의상 착용 이미지를 생성하는 방법을 제안했다. 특히, VTON 프레임워크에 디퓨전 모델을 접목하여, 이미지의 자연스러움과 일관성을 크게 향상시킨 점이 인상적이었다. 이번 발표에서는 Pose-Aware Virtual Try-On Network(PA-VTON)를 중심으로, 포즈 인식과 ControlNet을 결합하여 보다 정교한 가상 의상 착용 이미지를 생성하는 과정을 상세히 설명했다. 실험 결과, 제안된 방법은 기존의 VTON 모델들보다 높은 성능을 보였으며, 실제 의상 착용과 매우 유사한 이미지를 생성하는 데 성공했다.