- 2024년 12월 27일 오전 11:42
- 조회수: 2243
INFORMATION
- 2024년 12월 27일
- 오전 12시 ~
- 온라인 비디오 시청 (YouTube)
TOPIC
On-Line Video
OVERVIEW
요약
이미지 생성 분야에서 뛰어난 성능을 보이는 디퓨젼 모델은 사용자 입력 프롬프트를 받아 이미지를 생성한다. 그러나 생성된 이미지가 사용자 프롬프트를 완벽하게 반영하는 것은 어려운 과제이며, 프롬프트에 맞지 않는 이미지가 생성되기도 한다. 특정 객체가 생성되지 않는 Missing Object, 잘못된 객체와 속성이 매칭되는 Attribute Binding이 이러한 문제에 해당된다. 본 세미나는 디퓨젼 모델이 사용자 프롬프트를 효과적으로 반영해 이미지를 생성하도록 하는 방법론에 대해 소개한다.
[참고문헌]
[1] Rombach, Robin, et al. "High-resolution image synthesis with latent diffusion models." Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2022.
[2] Rassin, Royi, et al. "Linguistic binding in diffusion models: Enhancing attribute correspondence through attention map alignment." Advances in Neural Information Processing Systems 36 (2024).
[3] Agarwal, Aishwarya, et al. "A-star: Test-time attention segregation and retention for text-to-image synthesis." Proceedings of the IEEE/CVF International Conference on Computer Vision. 2023.