[학회후기]
2024년 5월 30일 양재에서 열린 한국데이터마이닝학회에 참석하였다. 작년 추계학술대회와 마찬가지로 엘타워에서 진행이 됐으며, 이번 학회는 발표자가 아닌 참석자로 처음 참여하게 되었기에 감회가 새로웠다. 다양한 소주제로 구성된 세션에서 원하는 발표를 들을 수 있었으며, DMQA 의 동료 연구원들의 발표 또한 많이 진행되었다. 발표가 끝난 뒤 발표자에게 직접 질의응답을 할 수 있는 시간도 주어졌는데, 이때 발표에 대한 궁금증 또한 해결 할 수 있었다. 이번엔 컴퓨터 비전 관련 발표를 위한 세션도 있었는데, 특히 흥미롭게 청취 할 수 있었다.

[청취후기]
MRI data augmentation via Denoising Diffusion Probabilistic Model
본 연구는 디퓨전 모델을 MRI 이미지 도메인에 적용한 연구다. MRI 이미지는 일반 이미지와 다르게 수집 시 다른 양상을 띈다는 것을 알게 되었으며, 본 연구에서는 디퓨전에서 일반적으로 사용하는 가우시안 노이즈 대신 MRI 이미지의 특성에 특화된 rician 노이즈를 사용했다. 이전부터 가우시안 노이즈 이외의 perturbation (simplex noise, blurring kernel 등) 을 디퓨전 프로세스에 적용 한 연구는 있었지만, 사용하는 이미지의 특성을 프로세스에 바로 적용한 점이 인상 깊었다. 한가지 의문점인 것은 디퓨전의 ELBO에서 유도된 손실함수를 사용하기 위해서 노이즈는 가우시안이어야 한다는 점이다. 본 발표에서는 해당 부분에 대한 언급이 없었지만, 추가적으로 찾아보니 아직 해당 부분을 설명한 연구는 없다는 것을 알게 되었고 흥미로운 주제가 될 수도 있겠다고 생각했다.

포즈 인식 디퓨전 모델을 통한 가상 의상 착용
본 연구는 디퓨전 모델을 VTON (Virtual tryon) task 에 적용한 연구이며, 연구실의 박태남 연구원이 진행하였다. 기존 디퓨전 모델을 활용한 VTON 모델들은 특정 상황에서 생성되는 이미지가 많이 무너진다는 점을 보완한 연구이다. 해당 연구는 무너지는 특정 상황을 방지하기 위해 추가적인 컨디션을 모델에 넣는 방식으로 문제를 해결하였다. 박태남 연구원이 해당 연구를 처음 진행 할 때 부터 많은 조언을 구했고 이에 따른 브레인스토밍을 많이 해왔는데, 연구를 성공적으로 마치고 훌륭한 발표를 해준 박태남 연구원이 자랑스럽게 느껴졌다.