Tabular Data Generation: Practical Challenges & Foundational Approaches
- 2025년 5월 23일 오전 1:24
- 조회수: 170
INFORMATION
- 2025년 5월 23일
- 오전 9시 ~
온라인 비디오 시청 (YouTube)
발표자:
윤지현

TOPIC
Tabular Data Generation: Practical Challenges & Foundational Approaches
On-Line Video
OVERVIEW
요약:
생성모델의 발전과 함께 이미지·텍스트 분야에서는 대규모 사전학습 기반의 Generative Foundation Model(GFM)이 범용적인 데이터 생성 도구로 자리 잡고 있다. 그러나 정형 데이터는 열 구조, 변수 타입, 분포 특성 등의 이질성으로 인해 여전히 학습과 생성이 어렵고, 기존 생성기는 실제 downstream task 성능 향상에 미치는 효과가 제한적이다. 본 세미나에서는 이러한 맥락에서, 정형 데이터 생성을 바라보는 두 가지 주요 관점인 실용적인 문제 해결 접근과 범용 모델 기반 접근을 소개하고자 한다.
참고자료:
[1] D'souza, Annie, M. Swetha, and Sunita Sarawagi. "Synthetic Tabular Data Generation for Imbalanced Classification: The Surprising Effectiveness of an Overlap Class." AAAI (2025).
[2] Lin, Xiaofeng, et al. "CTSyn: A Foundational Model for Cross Tabular Data Generation." ICLR (2025).
[3] Zhang, Hengrui, et al. "Mixed-type tabular data synthesis with score-based diffusion in latent space." ICLR (2024).