스페인 바르셀로나에서 열린 2024 ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD) 학회에 참가했다. 스페인은 소문대로 뜨거운 태양과 열정적인 분위기가 인상적이었다.


1. 최근 인공지능 학회들이 급증하고, ICLR, CVPR, ICCV, NeurIPS, ICML 등의 주요 컨퍼런스가 강세를 보이면서 KDD의 규모가 줄어든 느낌이었다. 2019년에 참가했을 때에 비해 스폰서 기업들의 참여도 현저히 줄어 아쉬움이 남았다. 중국에서의 발표가 압도적으로 많았으나, 발표내용과 태도가 전반적으로 미흡했던 점도 아쉬웠다. 그나마 LLM이나 diffusion 같은 주제로 가득 찬 다른 학회들과는 달리 우리 연구실에서 주력하는 다변량 시계열 분석, 이상치 탐지, 강화학습, 다양한 응용문제 등의 주제가 고르게 발표된 것은 다행스러웠다.   


2. 이번 학회에서 3개의 키노트를 모두 들었고, time series, anomaly detection, label modeling 주제의 세션을 집중적으로 들었다. 시계열의 정의에 대해 새롭게 생각해 볼 수 있는 시간이었으며, pretraining의 중요성도 다시 한번 깨닫게 되었다. 또한, 시계열 데이터 자체의 정보와 함께 frequency 정보를 함께 이용한 연구도 흥미로웠다, 다만, 딥러닝의 최대 장점 중 하나가 feature engineering (feature를 추출하는 과정) 과정이 필요 없다는 것인데, Fourier transform 등을 이용해 frequency 정보를 추출하여 모델링에 사용하는 접근법 대해 의문이 들기도 하였다. 시공간 데이터 (spatio-temporal data)에서 anomaly detection을 효율적으로 수행하는 방법론들도 매우 흥미로웠다. 발표된 논문을 꼼꼼히 읽어 봐야겠다. Tabular 데이터에 대한 augmentation 방법론으로는 여전히 SMOTE가 주를 이루고 있었는데, 이번에 소개된 간단한 방법이 SMOTE(+SMOTE variants)의 성능을 뛰어넘는 것 같아 자세히 살펴볼 가치가 있다고 생각했다.


3. 바르셀로나는 유럽의 다양한 매력을 모두 품고 있는 도시였다. 고딕양식의 웅장한 성당, 중세시대의 오래된 건물과 돌길로 이루어진 골목길, 아름다운 지중해 해변, 따듯하고 밝은 성격의 사람들, 무엇보다도 빠에야, 꿀대구, 하몬, 타파스, 샹그리아 등의 맛있는 음식들이 인상적이었다. 바르셀로나 하면 생각나는 것들을 적으며 마무리한다. FC바르셀로나, 안토니 가우디, 파블로 피카소, 살바도로 달리, 호안 미로, 사그라다 파밀리에 성당, 구엘 공원, 사마란치 IOC위원장, 1992년 바르셀로나 올림픽, 황영조, 몬주익 언덕.