- 2025년 5월 23일 오전 1:24
- 조회수: 375
INFORMATION
- 2025년 5월 23일
- 오전 9시 ~
온라인 비디오 시청 (YouTube)
윤지현
TOPIC
On-Line Video
OVERVIEW
생성모델의 발전과 함께 이미지·텍스트 분야에서는 대규모 사전학습 기반의 Generative Foundation Model(GFM)이 범용적인 데이터 생성 도구로 자리 잡고 있다. 그러나 정형 데이터는 열 구조, 변수 타입, 분포 특성 등의 이질성으로 인해 여전히 학습과 생성이 어렵고, 기존 생성기는 실제 downstream task 성능 향상에 미치는 효과가 제한적이다. 본 세미나에서는 이러한 맥락에서, 정형 데이터 생성을 바라보는 두 가지 주요 관점인 실용적인 문제 해결 접근과 범용 모델 기반 접근을 소개하고자 한다.
청취자 후기
김성수
이번 세미나는 Tabular 데이터 생성에 대해 진행되었다. 크게 클래스 불균형한 상황에서 효과적으로 생성하는 법과 Foundational Approach를 소개했다. 클래스 불균형한 상황한 상황에서는 Condition을 세분화 했다는 특징을 갖는다. Major VS Minor가 아닌, Clear Major VS 헷갈리는 Major VS Minor로 컨디션을 주어 우수한 성능을 보였다. 개인적으로는 Foundational Approach가 꽤나 충격적이었다. 데이터 별로 변수 명도 다르고, 변수 형태도 달라서 Tabular에서는 Foundation 스타일 생성 모델은 불가능이라고 생각했다. 하지만, 해당 연구는 단순 값만 인코딩 하는 것이 아닌, 데이터에 대한 설명과 변수 명까지 다 Feature화하여 다양한 형태의 Tabular 데이터를 대응 가능하게 했다. 해당 연구를 기반으로 향후 Tabular 데이터에 대한 Foundation 모델 연구가 가속화될 것 같은데, 향후 행보가 기대된다. 유익한 세미나를 준비해준 윤지현 연구원님께 고맙다는 말을 전하며 세미나 후기를 마친다.