[학회 후기]
이번 2024 데이터마이닝 학회는 5월 30일 양재 엘타워에서 열렸다. 처음 참석하는 학회는 아니었지만, 점점 규모가 커지고 있다는 점을 느낄 수 있었다. 학회장의 규모도 넓어지고 발표도 많아진 것 같았다. 특히, 최근 인공지능 연구에서 화두인 생성 모델을 중심 키워드로 삼아 진행된 점이 매우 유익했다. 다양한 세션을 통해 생성 모델이 어떻게 산업 현장에 적용되고 있는지 알 수 있는 좋은 기회가 되었다.

[청취 후기] 
- 포즈 인식 디퓨전 모델을 통한 가상 의상 착용
이 발표는 우리 연구실의 박태남 연구원이 진행했으며, 평소 관심 있는 생성 모델을 기반으로 한 연구라서 흥미롭게 들을 수 있었다. 이번 연구에서는 포즈 인식 디퓨전 모델을 활용한 가상 의상 착용 기술에 대해 논의되었다. 기존의 VTON 시스템들이 현실감과 정확성에서 여러 제약을 가지고 있는 반면, 이번 연구에서는 포즈 인식 기반의 디퓨전 모델을 사용해 다양한 자세와 각도에서 자연스러운 의상 착용 이미지를 생성하는 방법을 소개했다. 특히 PA-VTON(Pose-Aware Virtual Try-On Network)와 ControlNet의 결합을 통해 이미지의 일관성과 자연스러움을 크게 향상시켰다. 실험 결과, 이 새로운 접근 방식이 기존 모델들보다 우수한 성능을 보였다는 점에서 인상 깊었다. 가상 의상 착용 기술의 한계를 극복하고 발전 가능성을 보여준 사례라고 생각하며, 산업공학적인 연구로서 매우 흥미롭게 들었다.

- WHY-Chain: Learning Language by Repeated "Why?" Questions as Children Do
이 발표는 시작부터 흥미로웠다. 이 연구는 어린 아이들이 계속해서 "왜?"라고 질문하면서 세상을 이해하는 방식을 모델링한 것이다. 연구자들은 LLM(LLaMA-chat 70b)에 특정 문장을 주고 반복적으로 "왜?"라는 질문을 입력해 상식 추론 데이터셋을 생성했다. 이 데이터셋을 T5 모델에 학습시켜 commonsense reasoning 성능을 측정한 결과, 기존보다 향상된 성능을 보였다. 이 방법을 다양한 연구에도 적용해볼 수 있을 것 같다.

- MRI data augmentation via Denoising Diffusion Probabilistic Model
 발표는 의료 데이터(MRI) 에 생성 모델을 적용하는 연구였고, 앞서 언급했듯 관심 분야라서 흥미있게 들었다. 많이 알려진 바에 같이, 의료 데이터는 특성상 데이터 수가 제한적이며, labeling 비용도 비싸기 때문에 데이터 augmentation이 중요하다. 연구자들은 diffusion 모델을 활용해 MRI 데이터를 증강하는 방법을 제안했다. 특히, 기존의 가우시안 노이즈 대신 Rician noise를 사용하여 더 높은 품질의 데이터를 생성하는 데 성공했다. 실험 결과, 증강된 데이터의 품질이 매우 높았으며, 이는 실제 의료 데이터 augmentation에 효과적일 것으로 생각한다. 나도 diffusion 모델을 학습할 때 단순히 Gaussian noise 만을 쓰는 경우가 많은데 이러한 방법도 생각해볼 수 있다는 점에서 유익했다.