[학회 후기]
2024년 5월 30일에 춘계 데이터마이닝 학회에 참석하였다. 데이터마이닝학회는 자주 참가하였지만, 이번 학회에서는 지도교수님이 학회장으로 주최하여 느낌이 조금 달랐다. 장소는 양재엘타워였고 몇번 방문했던 곳이라 익숙했다. 이번 학회에서는 연구실 후배들이 스태프와 발표자로, 선배들이 좌장으로 참여해 다양한 역할을 수행하며 학회를 빛냈다. 생성형 AI와 빅테이터 주제로 여러 연구들이 발표되었다.

[청취 후기]
- 오픈셋 능동 학습에서 학습 분포 외 데이터 탐지를 위한 사전 훈련된 시각-언어 모델을 활용
액티브 러닝에서, 학습에 도움이 되는 데이터와 그렇지 않은 데이터를 구분하는것이 매우 중요하다. 따라서 이러한 in-distribution(ID) 데이터와 out-of-distribution(OOD) 데이터를 구분하는 여러 방법론들이 있는데, 이 연구에서는 사전학습된 vision language model(VLM)인 CLIPN을 이용하여 이를 구분하였다. VLM의 장점은 이미지와 언어를 유사한 것끼리 거리가 가깝도록 학습되었기 때문에 이미지 데이터만 있더라도 이 데이터가 어느 클래스에 속하는지를 어느정도 도출할 수 있다는 것이다. 이를 이용하여 별도의 학습 없이 학습한 클래스들과 관련이 있는지 없는지를 확인할 수 있다. 또한 이러한 레퍼런스가 꽤나 정확하기 때문에, 결과적으로 액티브 러닝도 좋은 결과로 이어졌다.

- 포즈 인식 디퓨전 모델을 통한 가상 의상 착용
생성모델을 활용하여 의류를 입은 사람의 모습을 생성할 때, 반팔/긴팔 처럼 옷의 길이가 달라지거나, 팔이나 다리가 겹쳐지는 경우 이미지가 매우 부자연스럽거나 이상하게 생성되는 문제점이 있다. 이를 해결하기 위해, 포즈 정보를 컨디션으로 받는 디퓨전 모델을 제안하였다. PA-VTON(Pose-Aware Virtual Try-On Network) 기반으로 포즈 인식과 ControlNet을 결합하여 이러한 문제점들을 해결하였으며, 다양한 자세나 각도에서 자연스러운 의상 착용 이미지를 생성할 수 있었다.

- MRI data augmentation via Denoising Diffusion Probabilistic Model
의료 분야는 여러 이유로 데이터 수가 제한적이며, 높은 정밀도가 요구된다는 특징이 있다. 이 연구는 이러한 문제점을 해결하고자 대표적인 생성모델인 denoising diffusion probabilistic model(DDPM)을 활용하여 MRI 데이터를 증강하는 방법을 제안하였다. 또한 DDPM에서 일반적으로 사용하는 가우시안 노이즈 대신 Rician 노이즈를 적용하여 성능을 개선하였다. 이렇게 증강된 데이터의 품질이 보장된다면, 의료 데이터의 활용에 있어 큰 의미를 지닐 것 같다.