2025년 8월 28~29일 평창 알펜시아 컨벤션센터에서 열린 한국데이터마이닝학회 하계학술대회에 참가하였다. 이번 학회는 인생 첫 학회이자 첫 포스터 발표 자리였기 때문에 내가 진행 중인 연구 내용을 다른 사람들에게 잘 전달할 수 있을까 걱정이 돼서 연구 내용을 속으로 정리하면서 아침 일찍 평창으로 이동했다. 이번 학회는 구두 발표 세션포스터 발표 세션이 번갈아 진행되었고 특히 포스터 세션에는 학부 연구생부터 대학원생, 기업까지 약 130여 팀이 참가하여 다양한 분야의 최신 연구 성과를 접할 수 있었다. 발표 시간이 1시간 30분, 질의응답과 청취 시간이 1시간 30분으로 충분히 확보되어 있어서 다른 발표자들이 진행하고 있는 연구를 깊이 있게 이해하고 교류할 수 있는 뜻 깊은 시간이었다.


[구두 세션 후기]

가장 인상 깊었던 발표는 화이트스캔 안은희 대표님의 “공간 빅데이터 통합 의사결정 지원 AI 플랫폼 및 활용 사례” 강연이었다. Population, Traffic, Consumption 데이터를 종합적으로 활용하여 현실의 문제를 해결해 나가는 다양한 서비스 사례를 들을 수 있었다.

단순히 사람들의 위치나 이동 경로를 모니터링하는 수준을 넘어 소비쿠폰에 따른 지역 상권 활성화 효과를 예측하는 등 미래지향적 분석 서비스를 제공한다는 점이 특히 인상적이었다. 또한 Geo-scan(Web 기반 인구 시뮬레이션 플랫폼)을 활용하여 대규모 인파가 몰릴 경우 경찰 인력을 효율적으로 배치할 수 있는 시뮬레이션 분석이 가능하다는 점도 흥미로웠다. 마지막에는 XR 디바이스를 통해 원격 상황실에서도 인구 흐름과 밀집도를 직관적으로 파악할 수 있는 서비스가 소개되었는데 첨단 기기와의 결합을 통해 보다 신속하고 정확한 대응이 가능하다는 점에서 기술의 확장성을 잘 보여주었다. 이번 강연을 통해 데이터 기반 분석이 단순한 모니터링을 넘어 도시 안전 관리와 지역 경제 활성화에도 크게 기여할 수 있음을 실감할 수 있었다.


[포스터 세선 후기]

내가 발표한 주제는 “다변량 시계열 이상치 탐지를 통한 EUV 노광장비 Collector Mirror 오염 조기 탐지 모델 개발”이었다.

현재 EUV 노광장비에서 Collector Mirror 오염은 직접적으로 측정할 수 없기 때문에 Mirror 반사 전후의 EUV 에너지를 이용해 반사율을 간접적으로 산출하고 있다. 그러나 두 센서 데이터의 비율로 계산하다 보니 노이즈가 심하고 결국 장기 이동평균선을 활용해야 하는 한계가 있다. 이는 이미 오염이 상당히 진행된 이후에야 탐지할 수 있다는 문제로 이어진다. 이러한 문제의식을 바탕으로 나는 센서 간 상관관계와 군집화를 고려한 다변량 시계열 이상치 탐지 모델을 제안하였다.


발표 중 가장 먼저 받은 질문은 '15개의 센서 데이터만으로 비정상 시점을 정확히 판단할 수 있는가?' 였다. 실제 현업에서는 관측 가능한 센서 외의 외부 요인이 작용하는 경우가 많기 때문에 제한된 데이터만으로 비정상 시점을 포착하기 어려울 수 있다는 지적이었다. 이는 내가 실제로도 고민하고 있던 부분이다. Collector Mirror 오염이 매우 가속화되었던 시점을 비정상 레이블로 설정했음에도 불구하고 제안한 모델이 해당 구간의 이상치 점수가 거의 0에 가깝게 판정하는 문제가 있다. 이는 곧 그 구간의 센서 데이터 상에서는 뚜렷한 이상 징후가 나타나지 않았음을 의미한다. 이 질의 응답을 통해 15개 센서 외의 다른 외부 요인을 고려하지 못한 것은 아닌지, 레이블 처리 과정에 오류가 없었는지 다시 점검할 필요성을 깨달은 값진 시간이었다.