- 2025년 9월 1일 오후 8:36
- 조회수: 24

[학회 후기]
2025 한국데이터마이닝학회 하계학술대회에 참가했다. 무더운 서울의 날씨를 비웃기라도 하듯, 기차에서 내리마자 불어오는 선선한 공기가 설렘을 가져다 주었다. 원래 데스크 업무 때문에 학회 세션에 참여하기 힘들 줄 알았으나, 동료 연구원들의 배려로 많은 세션을 들을 수 있었다. 첫날에 진행된 세션 중에서는 "공간 빅데이터 통합 의사결정 지원 AI 플랫폼 및 활용 사례" 발표가 인상 깊었다. 발표자께서 본인이 화이트해커라고 소개했고, 그 관점에서 공간 정보를 어떻게 AI와 결합하여 실제 업무에 활용할 수 있는지에 대해서 강연하였다. 이어진 포스터 세션에서는 포스터 발표자로 참여하여 내 연구 주제를 발표했다. 1시간 30분 동안 진행되어 다소 목이 아팠지만, 그만큼 많은 분들이 설명을 들으러 오셔서 뿌듯했다. 다만 주변에 이상치 탐지 연구들이 많아서, 이를 포스터 발표하느라 제대로 보지 못했던 점이 아쉬웠다. 2일차에는 "Generative AI for Causal Reasoning: Foundation and Algorithm"이라는 발표가 인상적이었다. 학부 시절 인과추론이라는 분야에 대해서 접했는데, 이와 그래프 이론, diffusion model, llm까지 활용하여 더 신뢰 있는 인과 관계를 찾아가는 과정이 상당히 인상 깊었던 것 같다. 시원한 평창에서 오랜만에 여유로운 시간을 보냈고, 동료 연구자 분들에게서 연구 트렌드 및 방향성을 들을 수 있어서 좋았다. 작년 데이터마이닝 학회를 다녀오고 연구 방향성을 잡았는데, 이번에도 정말 뜻 깊고 앞으로의 연구에 도움이 될 조언과 설명들을 들었다.
[발표 후기]
주제: Sampling-Frequency-Aware Transformer for Unsupervised Anomaly Detection in Irregular Multivariate Time Series
시계열 이상 탐지는 산업 설비 고장, 의료 이상 징후 등 다양한 분야에서 중요한 역할을 한다. 그러나 기존 이상 탐지 기법은 규칙적인 샘플링과 결측 없는 관측값을 전제로 설계되어, 실제 환경에서 발생하는 불규칙 다변량 시계열(ISMTS)에는 적용이 어렵다는 한계를 가진다. 이에 ISMTS 에 특화된 이상치 탐지 프레임워크인 SFAformer 를 발표하였다. SFAformer는 원 시계열을 시간 간격 정보를 보존하는 다중 시간 어텐션(MTA)과 시점 및 변수 간의 상호작용을 함께 학습하는 변수-시간 트랜스포머(VTT)로 구성된다. 특히 VTT 내부에 패치 단위 어텐션 모듈을 추가하여 패치 간(inter-patch) 및 내부(intra-patch) 관계를 모두 학습함으로써 국소적·전역적 이상 패턴을 효과적으로 탐지한다.
#1
질문. ISMTS 상황을 다뤘다면, 기존 방법론과의 실험 비교는 어떻게 했나?
답변: 기존 방법론은 모두 결측이 없는 상황을 다루고 있기 때문에 동등하게 비교하기 쉽지 않았다. 따라서 정상을 가정한 모델을 비교 방법론으로 하되, 결측이 있는 상황을 가정하여 보간하는 형식으로 실험을 진행하였다.
#2
질문. ISMTS를 다루는 데 있어서 핵심적인 모듈이 무엇인가?
답변. 아무래도 MTA가 아닐까 싶다. MTA가 불일정한 간격의 벡터를 균일한 간격의 표현 벡터로 바꿔줘 모델로 하여금 정상적으로 정보를 입력 받게 한다.
[청취 후기]
1. Score-informed Neural Operator for Enhancing Ordering-based Causal Discovery (강지연, 고려대학교)
이번 발표는 기존 방법론의 한계를 인과 추론과 그래프 이론, 생성 모델 세 가지의 틀에서 설명한 것이 인상 깊었다. 발표자는 기존 접근법이 계산량과 메모리 측면에서 비효율적이며 결과의 안정성에도 문제가 있음을 지적하였고, 이를 해결하기 위해 SciNO라는 새로운 모델을 제안하였다. 이 모델은 단순한 성능 향상에 그치지 않고 결과의 안정성과 신뢰성을 인과의 측면에서 높였다는 점에서 흥미로웠다. 무엇보다 인공지능이 단순한 예측 도구를 넘어 데이터 속에 내재한 인과 관계를 이해하고 설명할 수 있는 방향으로 발전할 수 있음을 보여주었다는 점에서 큰 가능성을 느끼게 하였다. AI가 단순히 정답을 맞히는 수준을 넘어 ‘왜 그런 결과가 나왔는지’ 설명할 수 있는 도구로 발전할 수 있다는 기대를 갖게 한 발표였다.
2. Exploring the differences in adversarial robustness between ViT- and CNN-based models using novel metrics (허재혁, 서울대학교)
이번 발표는 딥러닝 모델이 가진 취약성에도 결과가 크게 달라질 수 있다는 문제를 다루고 있어 흥미로웠다. 발표에서는 특히 이미지 처리 분야에서 많이 쓰이는 CNN, ViT, 그리고 두 방식을 결합한 하이브리드 모델을 비교하며, 각각의 강건성을 실험적으로 검증한 결과를 보여주었다. 흥미로웠던 점은 상호보완적인 네 가지 민감도 지표를 제안해 모델이 얼마나 쉽게 흔들리는지를 구체적으로 측정했다는 것이다. ViT 계열 모델이 CNN에 비해 적대적 공격(Adversarial Attack) 상황에서 더 강건하다는 결론을 내린 부분이 연구 현장에서도 일반적으로 통용되는 결론이라, 민감도를 측정하는 지표가 어느 정도 정확함을 확인하였다. CV 분야 뿐만 아니라 다른 데이터 도메인에서도 제안된 새로운 평가 지표가 앞으로 다양한 연구와 실제 활용에서 중요한 기준이 될 수 있겠다는 생각이 들었다.