[학회 후기]

이번 데이터마이닝 학회는 11 22 ~ 23일까지 경주 화백컨벤션센터에서 개최되었다. 교수님들의 구두 발표와 학생들의 포스터 발표로 진행되는 기존과는 약간 다른 방식이 흥미로웠다. 포스터 발표를 통해 오히려 다른 학생들의 연구에 대해서 다양하게 질문해보고 이해가 안 되는 부분은 계속해서 질문을 하면서 더 깊이 있게 이해할 수 있어서 그런 부분이 아주 좋은 기회가 되었다.

 

[포스터 발표 후기]

주제: Vision-integrated Multimodal Framework For Time Series Forecasting

직관적인 선 그래프를 활용하여 미래를 예측할 수 있는 시계열 예측 모델을 제안하였다. 이러한 이미지 기반의 모델에 더해, 이 모델의 잠재력을 최대한 끌어올리기 위해 시간 의존성을 포착할 수 있는 추가 모달리티를 결합한 새로운 framework를 제안하였다. , 이미지 기반 모델을 통해 변수 간 관계를 포착하고, 시계열 데이터를 통해 장기 의존성을 포착하는 새로운 접근을 보여준다.

 

오히려 구두 발표 보다 연구에 대해 깊게 설명하고 다양하게 소통할 수 있었다. 그 중 같은 분야를 연구하고 있는 다른 연구원과 시계열 예측의 평가 metric에 대해서 깊게 이야기를 나눌 수 있었다. 특히 평가 시, pairwise 형태로 계산이 되는데 이것이 시계열 예측에서 정말 정확한 방법일까란 논의가 있었다. 사실 어떤 미래 예측값을 정확히 맞출 수 있을까란 근본적인 의문부터 시작할 수 있을 것이며, 어느 정도의 추세를 잘 반영하는 것이 더 좋을 수도 있지 않을까란 생각을 해보았다. 그런 관점에서 평가 metric을 이동 평균의 관점에서 해보는 것도 오히려 시계열 데이터에서 의미가 있지 않을까? 이러한 이야기를 나누면서 나 또한 새로운 관점에서 생각해 볼 수 있는 좋은 기회였다.

 

[청취 후기]


1.     디지털 헬스 및 웰빙을 위한 데이터 기반 참여 활성화 (KAIST 이의진 교수님)

컴퓨터는 도구에서 인간의 파트너로 진화해왔다. 그래서 인간과 AI의 상호작용이 매우 중요한데, 건강에 있어서도 wearable IoT 기기들로 인해 이러한 것이 가능해졌다. 특히 디지털 치료, 즉 디지털 기술을 활용하여 인간의 어떤 문제를 해결하는 분야에서는 더욱 더 인간과 컴퓨터의 상호작용이 중요하다. 이 때, 인간의 참여도가 매우 중요한데 어떻게 하면 데이터로부터 인간의 참여도를 높일까가 관심 연구 분야가 된다. 특히 여기서 잀상생활의 행동을 가지고 디지털 치료가 필요한 상황을 검출하고, 이 상황이 발생했을 때 어떻게 참여에 개입할 수 있는지가 중요하다. 이 과정에서 현실적으로 데이터셋이 제한되고 데이터를 잘 수집할 수 있는 플랫폼이 부족하며, 데이터의 품질 이슈도 발생하는 어려움이 있다. 개인적으로도 스마트워치를 통해 생체 리듬을 분석하고, 내 행동 패턴을 알아보곤 한다. 이런 단순 패턴의 데이터화를 넘어서 어떻게 활용하는지 이야기를 들을 수 있는 시간이였다.

 


2.     Granularity Fusion Transformer: 다중 세분성 패턴 기반 시계열 예측 방법론 (서울대 박진우)

현실 시계열 데이터는 연속적인 궤적에서 샘플링된 이산 데이터인데, 기존 연구들이 단일 세분성 데이터만 고려하다 보니 다른 세분성 수준의 변동을 놓쳤다. 이를 해결하기 위해 Granularity Fusion Transformer(GFT)를 제안한다. 해당 방법론은 데이터를 큰 추세와 다중 세분성 데이터로 decomposition을 한 후, 분리된 데이터들을 상호 보완적으로 병합하도록 patch-wise cross attention을 사용하여 유용성을 입증하였다. 사실 decomposition이나 위상을 동시에 고려해 데이터를 추정하는 연구는 보았는데, 이러한 관점을 주기가 다른 데이터를 추정하기 위해 적용하였다는 점이 신선한 관점이였다.