[학회 후기]

 

KAIST에서 열린 2025년 대한산업공학회 추계 학술대회에 참여했다. 간만에 서울을 벗어나 낯선 곳에서 열린 학회기에 기차를 탈 때부터 설렜던 기억이 난다. 더욱이 DMQA의 이름을 걸고 참여하는 마지막 학회기에, 각오 또한 남달랐다. 발표 순서가 첫 번째였기에, 기차에 내리자마자 발표 자료를 정리하고, 흐름을 생각 속에서 정리했다. 덕분에 조금은 떨렸지만, 첫 날에 내 연구 내용을 많은 연구원들에게 전할 수 있었다. 익일에는 보다 여유 있게 연구원들의 발표를 듣고, 산업 전반에서 활용되는 AI에 대해 생각해볼 수 있는 시간을 가졌다. 이번 학회 참가를 통해 연구에도, 향후 진로에도 의미 있는 결과물을 얻을 수 있었다.

 

[발표 후기]

 

주제: Deep Learning for Anomaly Detection in Irregular Multivariate Time Series

 

이번 발표에서는 불규칙 시계열에서 최초의 비지도 학습 기반 이상치 탐지 프레임워크인 SFAformer를 소개했다. 자동차 배터리 이상 감지, 공정 기간의 업데이트 등 공정 데이터에서 불규칙한 시계열이 발생하는데도 불구하고, 이에 특화된 이상치 탐지 프레임워크는 없다는 데에 주목했다. 결측치가 없는 regualar time series를 상정하여 설계된 딥러닝 구조의 한계를 보완하기 위해, irregularly sampled time series를 모델 설계부터 상정한 프레임워크를 제안했다.

 

SFAformer는 이러한 문제를 해결하기 위해, multi-time attention (MTA)를 도입하여 보간, 탈락 등을 하지 않고 모델 단에서 불규칙 시계열을 처리한다. MTAsparse한 불규칙 시계열을 고정된 길이의 벡터로 변환함으로써, 딥러닝 구조에 불규칙 시계열을 통합한다. 이후 변수와 시간 축을 각각 인코딩하는 dual encoder 구조를 채택함으로써, 시간 종속성과 변수 관계를 보다 잘 반영하고자 한다. 특히 시간 종속성을 반영하는 부분에서 패치 구조를 적용함으로써, 시계열의 지역적 맥락을 포착한다. 두 가지 경로로 representation을 산출하고, 이를 cross attention 모듈과 MTA를 통해 입력인 불규칙 시계열을 복원한다. 이러한 방식으로 복원 오차를 학습시켜, 비지도 학습으로 이상치 탐지를 수행하고자 한다.

 

SFAformer는 불규칙 시계열을 가정한 실험에서 최신 시계열 이상치 비교 방법론에 비해 월등한 성능을 보여주며, 불규칙 시계열 상황에서의 효용성을 입증했다. 여기에 더하여, 일반적인 시계열에서도 비교 방법론과 비교하여 경쟁력 있는 성능을 기록하여, 방법론의 확장성 및 일반화 가능성을 입증했다.

 

질문 1. 불규칙 시계열에서 이상치 탐지가 아닌 다른 task를 처리할 수 있는 모델들이 많은 것으로 아는데, 제안 방법론이 이러한 방법론의 성능을 이상치 탐지에서 이길 수 있을 것이라 생각하는지?

 

말씀주신 대로 forecasting, interpolation 등에서 불규칙 시계열을 처리할 수 있는 프레임워크들이 제안되고 있습니다. 하지만 시계열 복원의 측면에서 접근한 모델은 없었기에, SFAformer가 제안하는 방법이 이상치 탐지에서는 더 효과를 발휘할 수 있을 것이라 생각합니다.

 

질문 2. 일반 이상치 탐지에서도 좋은 성과를 얻었는데, 무엇이 원인이라고 생각하는지?

 

말씀주신 대로 일반적인 시계열에서도 SOTA 모델과 비견되는 성능을 기록해, 모델이 이 task에서도 경쟁력이 있는 것으로 판단하고 있습니다. 개인적인 생각으로는 시간 종속성과 변수 관계를 모두 고려할 수 있는 dual encoder 구조가 이상치 탐지에 효과적이었던 것으로 해석됩니다. 특히 local한 이상치가 많은 데이터셋에서 좋은 성능을 거둔 것으로 봤을 때, temporal encoder 부분에서 작은 패치들로 분할하고, 이를 반영한 것이 좋은 성과로 나타나지 않았나 생각합니다. 향후 이런 부분을 참고해서 regular time series에서 이상 탐지 task를 수행할 프레임워크 개발을 목표로 연구 진행하려고 합니다.

 

[청취 후기]

 

주제: From Agentic AI to Physical AI: 제조 AI의 미래와 도전

 

서울대학교 강필성 교수님께서 제조 현장에서의 agentic AI와 미래 방향성에 대해서 연구 내용을 발표하셨다. 평소에 agentic AI에 대해서 관심이 많았고, 이것이 실제적으로 어떻게 활용될 수 있을 것인지에 대해 고민했기 때문에 관심 있게 들었던 것 같다. 특히 제조 현장에서 중요한 시계열 예측 및 시계열 이상치 탐지를 프롬프트 하나로 수행하는 것을 보고 AI 시스템의 진화가 빠르게 되고 있구나를 느꼈다. 발표 후 과제의 결과물인 agentic AI를 시연했는데, agentic AI에서 핵심이 되는 오케스트레이터 부분이 원활하게 작동하는 것을 보고, 어떻게 프레임워크를 구성했는지 궁금했다. 더불어 시계열을 연구하는 사람으로써, LLM이 시계열 도메인에 깊숙하게 침투하고 있구나라는 것을 느끼게 해주었다. 향후 연구 방향에서 단일 모달이 아닌 멀티 모달적 관점으로 문제를 해결하는 것이 더 효율적일 수 있음을 느끼게 해준 발표였다.

 

 

주제: 바이오 디바이스 초기 배표를 위한 도메인 특화 파운데이션 모델

 

초기 단계의 바이오신호 기반 모니터링 시스템이 겪는 가장 현실적인 문제를 해결하기 위한 새로운 접근법을 제시했다는 점에서 매우 인상 깊었다. 특히 공개 데이터와 실제 임상 데이터를 통합해 도메인 특화 foundation model을 구성하고, 이후 제한된 장비 데이터에 대해 전이학습을 수행하는 전략은 제조 및 의료 AI에서 공통적으로 마주치는 데이터 가용성 문제를 다루고 있다고 느꼈다. 기존 단일 장비 데이터만으로 학습된 단순 모델보다 훨씬 높은 성능을 기록했을 뿐만 아니라, 범용 foundation model을 동일 조건에서 파인튜닝했을 때보다도 강한 일반화 능력을 확보했다는 실험 결과는 매우 설득력이 있었다. 이러한 결과는 도메인 갭, 노이즈, 라벨 부족이라는 산업 현장의 핵심 병목에 대해 실용적인 해결책을 제시한다는 점에서 의미가 크다고 생각한다. 또한 다양한 청진기·수집 환경에서 얻은 이질적인 데이터셋을 체계적으로 정리하여 사운드 길이, 샘플링레이트, 수집 장비의 차이를 비교한 표를 통해, 실제 현장에서 얼마나 큰 데이터 불균형과 변동성이 존재하는지를 명확히 보여준 점도 인상적이었다. 특히 발표에서 강조된 단순히 성능을 높이는 것을 넘어, 초기 필드 운영 환경에서 재현 가능하고 신뢰할 수 있는 모델을 구축해야 한다는 메시지가 기억에 남았다. 실제로 장비별 변화나 환경적 노이즈가 존재하는 상황에서도 안정적인 결과를 낸 실험 결과는, 향후 biosignal AI가 나아가야 할 방향을 잘 보여준다고 느꼈다.