2025 한국데이터마이닝학회 추계학술대회 - 박현우
- 2025년 9월 2일 오후 10:13
- 조회수: 11
Reviewed by
박현우

[학회 후기]
2025년 한국데이터마이닝학회 하계학술대회가 평창에서 개최되었다. 학회는 구두 발표와 포스터 세션으로 구성되었으며, 특히 포스터 세션은 캐주얼하면서도 열정이 넘쳤던 교류의 장이었다. 다양한 분야의 연구자들이 각자의 문제의식과 창의적인 해결 과정을 공유하는 모습을 보면서 새로운 인사이트와 함께 더 열심히 해야겠다는 자극을 받을 수 있었다. 나 또한 진행 중인 연구를 포스터 발표 하면서 여러 연구자들과 심도 있는 논의를 나눌 수 있었고, 덕분에 연구 방향성을 다각도로 점검하고 발전시킬 수 있는 소중한 기회를 가졌다.
[발표 후기]
주제: Multimodal In-Hospital Mortality Prediction via BYOL: Mitigating False Negatives without Negative Sampling
현재 진행하고 있는 연구는 시계열 EHR과 임상 노트의 멀티모달 데이터를 융합하여 병원 내 사망을 예측하는 것을 목표로 하였다. 기존 대조 학습(CL) 기반 정렬 방식은 환자 데이터 간 경계가 모호하여 의미적으로 유사한 샘플을 'negative'로 오분류하는 'False Negative' 문제가 있었다. 이러한 한계를 극복하고자 negative 샘플 없이 positive pair에만 집중하는 BYOL을 도입했다. 실험 결과, 제안 모델은 AUROC 및 AUPRC 지표에서 기존 CL 방식보다 우수한 성능을 달성하여, positive pair 중심 학습의 효과를 입증했다. 그러나 예측 성능 향상에도 불구하고, 임베딩 공간에서 사망/생존 클래스가 명확히 분리되지는 않았다. 이는 BYOL이 벡터를 물리적으로 가깝게 정렬하기보다, '사망 예측' 과제에 최적화된 공유 잠재 공간을 형성했을 것으로 판단했다. 즉, 복잡한 멀티모달 환경에서는 벡터 공간의 근접성이 반드시 성능 향상으로 이어지지 않을 수 있다는 점을 발견했다. 결론적으로 이번 연구는 임상 데이터 특성에 맞는 학습 전략의 필요성을 제기했으며, 향후 각 모달리티의 고유성은 보존하며 공유 공간에서 시너지를 내는 모델로 연구를 고도화할 계획이다.
#1. 단일 모달리티로만 학습했을 때의 성능도 비교해보았나요?
답변: 포스터에는 나와있지 않지만, 단일 모달리티(시계열 EHR, 임상 노트) 각각으로 성능 측정 해보았습니다. 그 결과 단일 모달을 사용했을 때의 예측 성능보다 멀티 모달을 사용했을 때의 예측 성능이 더 좋게 나왔던 것을 확인했습니다.
#2. Negative 샘플을 사용하지 않는 점이 임상 데이터에서 중요한 이유가 무엇인가요?
답변: 이번 연구의 멀티모달 학습 과정에서는 같은 환자의 두 모달리티 데이터(EHR과 임상노트)를 Positive 페어로 사용하기 때문입니다. Negative 샘플을 사용하지 않음으로써, 상태가 유사한 다른 환자들을 Negative로 잘못 판단하여 서로 밀어내는 False Negative 문제를 피할 수 있어, 샘플 간 경계가 모호한 임상 데이터 환경에서 중요합니다.
[청취 후기]
1. 공간 빅데이터 통합 의사결정 지원 AI 플랫폼 및 활용 사례
화이트 스캔의 기술 발표는 사이버 보안 분석에서 출발하여 이동, 소비 등 다양한 공간 데이터를 융합해 인구 밀집도를 예측하는 기술로 발전하며 데이터로 더 안전한 세상을 만드는 비전을 현실화하는 과정을 인상 깊게 보여주었다. 특히 이태원 참사를 계기로 재난 예방의 핵심 기술로 부상하여, 디지털 트윈 기반 시뮬레이션으로 최적의 안전 정책을 수립하고 XR 기기로 현장과 소통하는 등 미래형 재난 대응 시스템의 가능성을 제시했다. 또한, 복잡한 기술을 실제 정책 결정자가 효과적으로 사용하도록 지원하는 과정의 중요성을 강조하며, 결국 기술의 발전 방향은 사람을 향해야 한다는 근본적인 원칙을 다시 한번 일깨워준 의미 있는 시간이었다.
2. 산업계가 바라본 인공지능과 인재양성 방안
기업들이 AI 활용 능력을 갖춘 도메인 전문가(시니어)를 선호하게 되면서 신입 개발자의 입지가 좁아지는 현상과, 이것이 장기적으로 산업 경쟁력 약화로 이어질 수 있다는 딜레마를 지적한 부분이 인상 깊었다. 대학의 AI 융합학과들이 유행처럼 번지고 있지만, 근본적인 혁신을 이끌 핵심 인재와 산업 현장의 문제를 해결할 융합 인재를 구분하여 맞춤형 교육 로드맵을 설계해야 한다는 의견이 흥미로웠다. 건강한 인공지능 산업의 선순환 고리를 만들기 위해서 산업계의 목소리를 교육에 어떻게 녹여낼 것인지, 그리고 해외로 떠나는 인재들을 어떻게 붙잡을 것인지에 대한 현실적인 고민이 우리 모두에게 주어진 과제임을 다시 한번 느끼게 되었다.