[학회 후기]

2024년 5월 30일 양재 엘타워에 열린 한국데이터마이닝학회 춘계 학술대회에 참석하였다. 작년인가 재작년 쯤에는 발표자의 입장에서 참석한 적이 있는데, 그 때는 나의 발표만 신경쓴다고 다른 알짜배기 연구들을 제대로 듣지 못했었다. 올 해는 청취자의 입장에서 어떠한 연구들이 있는지 다양하게 들어볼 수 있었다.


[청취 후기]

TA-Net: Tri-Aspect Network for Camouflaged Object Detection

일반적인 객체 탐지가 아닌 위장 객체 탐지(Camouflaged Object Detection; COD)라는 주제에 대한 연구였는데, 생소한 연구분야지만 상당히 흥미롭게 느껴졌다. 주변 배경과 유사한 질감이나 시각적 특성을 가지고 있어 식별하기 어려운 객체를 탐지하기 위한 분야로, 군사 분야에 많이 응용될 수 있을 것 같다. 본 연구에서는 위장 객체 탐지를 위한 방법론으로 TA-Net이라는 네트워크를 제안하였다. TA-Network는 1. Object Awareness를 위해 RGB 이미지를 HSV로 전환하고, 이 과정에서 발생한 패턴의 차이를 기반으로 대략적인 위치를 예측하는 Color Network, 2. Gray Scale 이미지와 Sobel 필터를 활용하여 이미지의 강조되는 부분을  탐지하는 Edge Network, 3. Bayar Convolution과 Erosion Kernel을 활용해 이미지의 질감차이를 예측하는 texture network 3가지로 구성되어 있다. 생소한 기법(sobel filter, bayar convolution)들이 많이 적용되어 알고리즘을 디테일하게 파악하기는 어려웠지만, 굉장히 신박하면서도 중요한 연구분야를 알게 된 것 같아서 기억에 많이 남았다.


마스킹 기반 지도학습을 활용한 RGB-D 중요 물체 검출

해당 연구 또한 객체 탐지의 하위 분야 중 하나인 중요 객체 탐지(Salient Object Detection)에 대한 연구였다. 우리가 관측하는 실제 이미지 혹은 비디오에서는 수 많은 객체를 탐지할 수 있지만, 실제로 탐지하고 싶은 객체는 따로 있기 때문에 중요한 연구분야인 것 같았다. 해당 분야는 RGB 이미지뿐만 아니라 깊이 정보까지 고려하는 RGB-D 기반 데이터를 주로 사용하는데, 이렇게 Depth까지 존재하는 데이터는 실제로 구하기가 어렵다. 이러한 문제를 해결하기 위해 Siam Network 구조와 마스킹 재구축 학습을 활용하여 성능을 끌어올리고자 한 연구였다. 방법론 자체는 긍정적인 측면에서 매우 심플해서 좋았고, 새로운 연구 분야에 대해 하나 더 알아갈 수 있었다.


MRI data augmentation via Denoising Diffusion Probabilistic Model

일반적으로 많은 양을 구하기 어려운 MRI 데이터를 증강하기 위해 최근 화두가 되고 있는 Diffusion 모델을 적용한 방법론이다. 예전에 박태남 연구원 세미나에서 의료 데이터의 이상탐지에 Diffusion을 적용한 AnoDDPM이라는 논문을 접한적이 있는데, 본 연구도 목적은 다르지만 비슷한 접근법으로 의료 데이터를 생성하였었다. AnoDDPM의 경우 기존 Diffusion에서 사용하는 Gaussian Noise가 아닌 Simplex Noise를 사용하였는데, 이는 의료 데이터에서 발생하는 Noise가 좀 더 Simplex Noise에 부합하기 때문이었던 것으로 기억한다. 본 연구에서는 MRI의 분포적 특성을 더욱 잘 반영하는 Rician Noise를 적용하여 MRI를 생성하였으며, 해당 Noise의 적합성을 판단하기 위해 기존의 두 Noise와 함께 비교실험을 하여 성능을 입증하였다. 해당 세션 좌장님과 동일하게 문득 질문이 드는 생각이 있었는데, 기존 DDPM의 수식은 Gaussian일때만 성립이 되는 것으로 알고 있었는데 Simplex Noise나 Rician Noise를 써도 똑같은 ELBO 수식이 나오는지 궁금하였다.