[학회 후기]

2025년 8월 28~29일 강원도 평창 알펜시아에서 열린 한국데이터마이닝학회 하계학술대회에 참가하였다. 이번 학회는 구두 발표 세션과 포스터 발표 세션이 병행되었으며, 작년보다 참가자와 발표 수가 눈에 띄게 늘었다. 특히 포스터 세션에서는 다양한 연구자들과 직접 토론할 수 있었고, 그 과정에서 여러 의견과 피드백을 교류할 수 있었다. 올해는 대규모 언어 모델(LLM)을 다루는 연구가 크게 증가했으며, 인문·사회과학적 개념을 접목한 시도도 일부 눈에 띄었다. 이를 통해 학계의 전반적인 연구 흐름을 확인할 수 있었고, 앞으로의 연구 방향을 고민하는 데 참고가 되었다. 종합적으로, 연구 교류와 네트워킹을 통해 얻은 경험이 유익했으며, 연구 트렌드를 파악하는 좋은 기회였다.

[발표 후기]

주제: Semi-Supervised Analytic Federated Learning (SS-AFL)
본 연구에서는 labels-at-server 시나리오에서의 federated semi-supervised learning (FSSL) 문제를 다루었다. 기존 방법들은 서버는 소량의 라벨 데이터로 학습하고, 클라이언트는 pseudo-label을 기반으로 학습을 수행한다. 하지만 이 경우 client drift(비라벨 데이터 기반 학습으로 인한 전역 방향성과의 괴리)와 supervision forgetting(라벨 신호의 점진적 소실) 문제가 발생한다. 이를 해결하기 위해 본 연구에서는 analytic learning(폐형 해 기반 학습)을 FSSL에 통합한 SS-AFL 프레임워크를 제안하였다. 핵심은 SS-AA Law라 불리는 partitioned Moore–Penrose inverse 기반의 통합 규칙으로, 서버와 클라이언트에서 각각 학습된 analytic head를 수학적으로 일관된 방식으로 집계하는 것이다. 실험 결과, CIFAR-10/100, SVHN 벤치마크에서 기존 FSSL 방법보다 더 높은 정확도와 안정적인 성능을 달성하였다. 포스터 발표에서는 pseudo-label 품질 관리와 analytic aggregation을 통한 안정성 확보라는 두 가지 측면에서 연구 필요성을 강조할 수 있었고, 여러 연구자들과 유의미한 논의를 나눌 수 있었다.

질문 1: Analytic learning을 통합하셨다고 했는데, gradient-based 업데이트 방식보다 어떤 이점이 있나요?
답변 1: analytic learning은 폐형 해를 통해 head parameter를 한 번에 계산하므로, 반복적인 local optimization 과정에서 발생하는 client drift를 줄여줍니다. 즉, 각 클라이언트의 업데이트가 방향성에서 크게 벗어나지 않게 하고, 서버-클라이언트 간 라벨/비라벨 분리 구조에서도 일관성 있는 통합이 가능해집니다.

질문 2: SS-AA Law에서 partitioned Moore–Penrose inverse를 사용한 이유가 있나요?
답변 2: 서버와 클라이언트 head는 서로 다른 데이터 분포(라벨 vs 비라벨)에 기반해 학습되므로 단순 평균(FedAvg)으로는 결합이 불안정합니다. Moore–Penrose inverse를 활용하면 feature space에서의 least-squares optimal solution을 구할 수 있고, partition 구조를 통해 서버-클라이언트 supervision을 균형 있게 반영할 수 있습니다.

[청취 후기]

1. ReactionReasoner: Reasoning LLM for Chemical Reaction Prediction
이 연구는 대형 언어모델(LLM)을 활용하여 단순히 화학 반응의 결과만 예측하는 것을 넘어, 왜 그런 결과가 나오는지까지 설명할 수 있도록 설계한 점이 인상적이었다. 지금까지의 화학 반응 예측 모델은 결과 예측에만 집중했지만, ReactionReasoner는 반응 과정을 추론적으로 기술해 연구자들이 반응 메커니즘을 이해하는 데 도움을 준다. 단순한 예측을 넘어 새로운 화학적 현상을 밝히는 실마리를 제공할 수 있다는 점에서 의미 있는 시도로 느껴졌다.

2. Continual Self-Supervised Learning for Skeleton-based Human Action Recognition
이 연구는 행동 인식 분야에서 발생하는 catastrophic forgetting 문제를 해결하기 위해 자기지도학습 기반의 지속적 학습 프레임워크(CSSL-S)를 확장한 것이다. Spatial-Temporal Graph Convolutional Network(ST-GCN)을 적용해 시공간적 관계를 효과적으로 모델링하고, 라벨 없이도 강력한 표현을 학습할 수 있도록 했다. 새로운 행동 데이터를 학습하면서도 기존 지식을 안정적으로 유지하는 접근은 실제 응용 가능성이 높아 보였다. 발표를 들으면서 CSSL에 특화된 loss를 추가하면 더욱 강력한 방법이 될 수 있겠다는 생각이 들었다.