Conference

Conference

Number of entries: 704 (필터 적용됨)
03
2025.09

2025 한국데이터마이닝학회 추계학술대회 - 허종국

[학회 후기]작년 데이터마이닝 학회는 경주에서 개최되었었는데, 올해는 하계 학술대회로 평창에서 개최되었다.  작년에 대비해 포스터 세션이 늘어나 더 많은 발표를 심도있게 들을 수 있었다. 가장 좋았던 점은 카이스트 권창현 교수님 그리고 한국인공지능 협회의 박연정 전무님 등 새로운 연사분들이 대거 참여하셔서 물류 시스템 쪽에서의  AI 연구 동향이나 연구를 넘어 산업계에서 필요한 AI가 무엇인지 등에 대해 발표해주셨다. 마지막에는 4분의 연사분들이 'AI 시대의 교육, 연구, 산학협력, 국제화'라는 주제로 토론을 진행해주셨는데, 그 중 특히 강필성 교수님께서 말씀해주신 AS-IS(Answer, Memorize)에서 TO-BE(Ask, Retrieve)하는 인재가 되라는 장표가 가장 인상 깊었다. 해당 장표에 인상깊었던 사람이 많았는지, 패널 디스커션 때 가장 많은 질문이 오갔던게 기억이 남는다.[발표 후기]제목: Policy-Relevant Query Sampling and Dynamic Critic Reset for Efficient Preference-based Reinforcement Learning발표 후기 : 이번에 발표한 주제는 선호 기반 강화학습에서 발생하는 두 가지 문제를 해결하기 위한 연구를 발표하였다: 첫 번째는 query-policy misalignment로써, 기존 PbRL에서 선택되는 query가 현재 정책과는 거리가 멀어 실제로 정책 개선에 도움이 되지 않는 현상이다. 기존 연구인 QPA에서는 이러한 문제를 해결하기 위해 가장 최근 데이터에서 query를 뽑는 방법을 제시하였지만, 가장 최근 데이터라고 해서 현재 policy와 연관성이 높지는 않다는 것을 실험적으로 보였다. 이후, 이러한 문제를 해결하기 위해 현재 정책을 활용하여 해당 query가 발생할 확률인 likelihood를 계산해서 likelihood가 높은 데이터를 뽑는 샘플링을 제안하였다. 두 번째 문제는 online learning에서 발생하는 primcy bias, 그리고 이로 인해 발생하는 overestimation 문제이다.  PbRL에서 보상 함수는 순차적으로 쌓이는 feedback data에 계속해서 학습이 되게 되는데, 이로 인해 학습 초기 데이터에 과한 영향을 받게 된다. 이로 인해 학습 초기에 발생한 low-quality feedback에 대한 reward divergence가 커지게 됨으로써, overestimation이 발생하게 된다. 이러한 현상을 해결하기 위해 보상 함수와 이에 영향을 받는 Q 함수를 reset하는 방법을 제안하였으며, monotonic하게 증가하는 threshold에 대해 Q값이 임계값을 넘으면 reset하는 방식으로 고안되었다.학회 발표를 할 떄 마다 느끼는 것 중 하나는 강화학습, 그 중에서 선호 기반 강화학습이라는 분야가 생소한 만큼, 좀 더 장표를 쉽고 직관적으로 만들 수는 없었을까라는 아쉬움이다. 매번 개선하려고 노력하고 발표도 연습하지만, 실제 현장에 가서는 좀 처럼 잘 되지 않는다. 이번 학회 포스터에서 아쉬웠던 것을 발판 삼아 다음 확회에서 보완하는 방식으로, 조금씩 나아가는 것을 목표로 하고 있다.질문 1 : 두 번째 컴포넌트인 리셋 부분에서 threshold 선정 방식이 너무 heuristic한데 그 근거가 무엇인가요?답변 1 : 해당 threshold의 구체적인 산정 방식은 다소 heuristic할 수 있지만, monotonic하게 increasing한다는 점을 주목해야합니다. 실제 강화학습에서 1. reset은 primacy bias를 줄일 수 있다는 점, 2. critic output(Q-value)는 overestimation을 파악하는데 도움이 된다는 점, 3. policy improvement theorem에 의해 Q-value는 항상 증가해야한다는 점을 토대로 만들어졌습니다. monotonic하게 증가하는 스케줄 방식이라면 다른 스케줄링 방식도 큰 효과가 있을 것이라 생각합니다.[청취 후기]제목 : Calibration for Improving Safe Semi-Supervised Learning내용 : 실제 환경에서 자주 발생하는 label distribution mismatch 문제, 소위 out-of-distribution (OOD) 문제를 해결하기 위한 연구이다. 이러한 safe SSL 방법론들은 overconfidence로 인해 classification의 pseudo-label이나 OOD detection에서 오류를 증가시키는 원인이 된다. 이러한 문제를 해결 하기 위해 classifier와 ood detector에 calibration을 적용하는 safeSSL 방법론을 제안하였다. 가장 대표적인 이미지 데이터셋인 CIFAR-10/100, SVHN, TinyImageNet 벤치마크, 그리고 공인된 비교방법론들과 함꼐 폭넓게 비교 실험한 후 성능을 입증하였다.진수형의 발표였는데, 전반적으로 연구 배경, 실험의 구성, 방법론 수식의 탄탄함이 돋보이는 연구였다. 연구의 흐름이나 진행 방식에서 본받을 부분이 많았다.
Reviewed by 허종국 허종국
2025.09.03
Read More
02
2025.09

2025 한국데이터마이닝학회 추계학술대회 - 임새린

[학회 후기]작년 경주에 이어서 이번에는 평창 알펜시아 리조트에서 열리는 2025 하계 데이터마이팅 학회에 참석하였다. 이번 학회에는 작년보다 훨씬 사람들이 많고 학회 프로그램도 다양해서 더 재미있게 즐길 수 있었다. 특히 포스터 세션의 시간이 2시간에서 3시간으로 늘어나면서 여러 학교 학생들의 다양한 연구를 경험 할 수 있었다.나와 비슷한 분야의 연구가 없어서 아쉬웠지만, 어떤 연구 분야들이 주류를 이루는지, 이러한 방법론들을 실제 산업에 어떻게 활용하는지를 배울 수 있었다.[발표 후기]이번 학회는 작년과 마찬가지로 포스터 발표를 진행하였다. 이번에 발표한 연구는 'Adaptive Consistency Learning Framework for Unknown Class Recognition in Open-Set Semi-Supervised Learning'로 open-set semi-supervised learning의 알고리즘을 개발한 연구이다. 기존 open-set semi-supervised learning 방법론으로 학습된 classifier가 OOD 샘플을 잘 구분하지 못하여, OOD 샘플이 pseudo-label로 사용되는 문제를 해결하기 위한 방법론으로 크게 두 단계로 구성되어 있다. 1) 먼저, logit vector와 OOD score를 활용하여 unlabeled sample에서 open-set knowledge를 추출하고, 2) 추출된 open-set knowledge를 OOD-aware consistency regularization을 통해 classifier로 직접 전달한다. 이러한 방식을 통해서 classifier의 OOD 구분 능력을 올리고 더 정확한 pseudo-label을 얻어 모델 성능을 개선한다. 포스터 발표를 진행하면서 항상 아쉬운 점은 포스터 용지에 모든 내용을 다 담지 못한다는 것이다. 특히 내 연구 분야를 아예 모르는 분들이 오면 semi-supervised learning 중 fixmatch부터 설명해야 전체적으로 이해하기가 수월한데 이러한 내용을 담지 못해 잘 이해시키지 못했다는 느낌을 받았다. 다음 학회에서는 이러한 부분을 고려해 더 좋은 발표를 해야겠다고 느꼈다.질문 1 : classifier의 OOD 구분 능력은 학습 중 계속 올라가는데, pseudo-label은 오히려 조금씩 떨어지는 추세인데 그 이유를 알 수 있을까요?답변 1 : 제 방법론은 모든 class의 OOD score와 logit을 weighted sum하여 OOD class에 대한 logit을 추정합니다. 따라서, under- / over-estimation 문제가 발생할 수 있는데 이를 해결하기 위한 rank-based reweight 전략을 도입하였습니다. 그럼에도 불구하고 학습이 진행되면서 조금씩 ID 샘플을 OOD 샘플로 예측하는 over-estimation 문제가 발생하여 pseudo-label 정확도가 조금씩 떨어지는 현상이라고 이해해 주시면 됩니다. 이 문제는 향후 reweight 함수를 고도화 하여 해결할 예정입니다.[청취 후기]주제: 심층 신경망 내 레이어 간 균형 학습을 위한 스펙트럴 놈 분산 정규화신경망 모델의 깊이가 깊어질수록 레이어 간 학습 정도에 불균형이 발생하여 전체 신경망의 일반화 성능에 악영향을 끼친다. 이를 해결하기 위해 레이어 간 학습 불균형을 해소하기 위해 레이어마다 학습률을 유동적으로 조절하는 방법론이 제안되었지만 , 이러한 방식은 정밀한 튜닝 절차를 요구한다. 최근에는각 레이어에 직접적으로 정규화를 적용함으로써 레이어간 학습 균형을 맞추려는 시도가 이어지고 있다. 해당  연구에서는 신경망 내 layer 간 정보 흐름의 불균형을 완화하기 위한 Spectral Norm Variance Regularization(SNVR)을 제안한다. SNVR 은 각 layer 의 spectral norm 의 크기를 제한하는 동시에, 분산에 대한 정규화 항을 목적 함수에 추가하여 layer 간 비슷한 수준의 정보 흐름을 가질 수 있도록 한다. 실험을 통해 SNVR 이 정보 흐름의 균형을 학습하도록 유도하여 개별 layer 의 학습 안정성을 향상시키고, 나아가 전체 신경망의 일반화 성능을 개선할 수 있음을 검증했다.최근 프로젝트를 하면서 거대 파운데이션 모델을 새로운 도메인에 전이할 때, 레이어 간의 표현력 차이에 대한 연구가 많다는 것을 느꼈고, 해당 포스터에 흥미를 가지게 되었다. 레이어별로 학습률을 조정하는 기법이 있다는 것 정도만 알고 있었는데 이 포스터 발표를 통해서 직접적으로 레이어에 규제를 가하는 방식이 있다는 것을 알게 되었다. 이러한 기법을 통해서 프로젝트를 해결하는데 도움이 되었으면 한다.
Reviewed by 임새린 임새린
2025.09.02
Read More
02
2025.09

2025 한국데이터마이닝학회 추계학술대회 - 고재영

2025년 8월 28~29일 평창 알펜시아 컨벤션센터에서 열린 한국데이터마이닝학회 하계학술대회에 참가하였다. 이번 학회는 인생 첫 학회이자 첫 포스터 발표 자리였기 때문에 내가 진행 중인 연구 내용을 다른 사람들에게 잘 전달할 수 있을까 걱정이 돼서 연구 내용을 속으로 정리하면서 아침 일찍 평창으로 이동했다. 이번 학회는 구두 발표 세션과 포스터 발표 세션이 번갈아 진행되었고 특히 포스터 세션에는 학부 연구생부터 대학원생, 기업까지 약 130여 팀이 참가하여 다양한 분야의 최신 연구 성과를 접할 수 있었다. 발표 시간이 1시간 30분, 질의응답과 청취 시간이 1시간 30분으로 충분히 확보되어 있어서 다른 발표자들이 진행하고 있는 연구를 깊이 있게 이해하고 교류할 수 있는 뜻 깊은 시간이었다.[구두 세션 후기]가장 인상 깊었던 발표는 화이트스캔 안은희 대표님의 “공간 빅데이터 통합 의사결정 지원 AI 플랫폼 및 활용 사례” 강연이었다. Population, Traffic, Consumption 데이터를 종합적으로 활용하여 현실의 문제를 해결해 나가는 다양한 서비스 사례를 들을 수 있었다.단순히 사람들의 위치나 이동 경로를 모니터링하는 수준을 넘어 소비쿠폰에 따른 지역 상권 활성화 효과를 예측하는 등 미래지향적 분석 서비스를 제공한다는 점이 특히 인상적이었다. 또한 Geo-scan(Web 기반 인구 시뮬레이션 플랫폼)을 활용하여 대규모 인파가 몰릴 경우 경찰 인력을 효율적으로 배치할 수 있는 시뮬레이션 분석이 가능하다는 점도 흥미로웠다. 마지막에는 XR 디바이스를 통해 원격 상황실에서도 인구 흐름과 밀집도를 직관적으로 파악할 수 있는 서비스가 소개되었는데 첨단 기기와의 결합을 통해 보다 신속하고 정확한 대응이 가능하다는 점에서 기술의 확장성을 잘 보여주었다. 이번 강연을 통해 데이터 기반 분석이 단순한 모니터링을 넘어 도시 안전 관리와 지역 경제 활성화에도 크게 기여할 수 있음을 실감할 수 있었다.[포스터 세선 후기]내가 발표한 주제는 “다변량 시계열 이상치 탐지를 통한 EUV 노광장비 Collector Mirror 오염 조기 탐지 모델 개발”이었다.현재 EUV 노광장비에서 Collector Mirror 오염은 직접적으로 측정할 수 없기 때문에 Mirror 반사 전후의 EUV 에너지를 이용해 반사율을 간접적으로 산출하고 있다. 그러나 두 센서 데이터의 비율로 계산하다 보니 노이즈가 심하고 결국 장기 이동평균선을 활용해야 하는 한계가 있다. 이는 이미 오염이 상당히 진행된 이후에야 탐지할 수 있다는 문제로 이어진다. 이러한 문제의식을 바탕으로 나는 센서 간 상관관계와 군집화를 고려한 다변량 시계열 이상치 탐지 모델을 제안하였다.발표 중 가장 먼저 받은 질문은 '15개의 센서 데이터만으로 비정상 시점을 정확히 판단할 수 있는가?' 였다. 실제 현업에서는 관측 가능한 센서 외의 외부 요인이 작용하는 경우가 많기 때문에 제한된 데이터만으로 비정상 시점을 포착하기 어려울 수 있다는 지적이었다. 이는 내가 실제로도 고민하고 있던 부분이다. Collector Mirror 오염이 매우 가속화되었던 시점을 비정상 레이블로 설정했음에도 불구하고 제안한 모델이 해당 구간의 이상치 점수가 거의 0에 가깝게 판정하는 문제가 있다. 이는 곧 그 구간의 센서 데이터 상에서는 뚜렷한 이상 징후가 나타나지 않았음을 의미한다. 이 질의 응답을 통해 15개 센서 외의 다른 외부 요인을 고려하지 못한 것은 아닌지, 레이블 처리 과정에 오류가 없었는지 다시 점검할 필요성을 깨달은 값진 시간이었다.
Reviewed by 고재영 고재영
2025.09.02
Read More
02
2025.09

2025 한국데이터마이닝학회 추계학술대회 - 박현우

[학회 후기]2025년 한국데이터마이닝학회 하계학술대회가 평창에서 개최되었다. 학회는 구두 발표와 포스터 세션으로 구성되었으며, 특히 포스터 세션은 캐주얼하면서도 열정이 넘쳤던 교류의 장이었다. 다양한 분야의 연구자들이 각자의 문제의식과 창의적인 해결 과정을 공유하는 모습을 보면서 새로운 인사이트와 함께 더 열심히 해야겠다는 자극을 받을 수 있었다. 나 또한 진행 중인 연구를 포스터 발표 하면서 여러 연구자들과 심도 있는 논의를 나눌 수 있었고, 덕분에 연구 방향성을 다각도로 점검하고 발전시킬 수 있는 소중한 기회를 가졌다.[발표 후기]주제: Multimodal In-Hospital Mortality Prediction via BYOL: Mitigating False Negatives without Negative Sampling현재 진행하고 있는 연구는 시계열 EHR과 임상 노트의 멀티모달 데이터를 융합하여 병원 내 사망을 예측하는 것을 목표로 하였다. 기존 대조 학습(CL) 기반 정렬 방식은 환자 데이터 간 경계가 모호하여 의미적으로 유사한 샘플을 'negative'로 오분류하는 'False Negative' 문제가 있었다. 이러한 한계를 극복하고자 negative 샘플 없이 positive pair에만 집중하는 BYOL을 도입했다. 실험 결과, 제안 모델은 AUROC 및 AUPRC 지표에서 기존 CL 방식보다 우수한 성능을 달성하여, positive pair 중심 학습의 효과를 입증했다. 그러나 예측 성능 향상에도 불구하고, 임베딩 공간에서 사망/생존 클래스가 명확히 분리되지는 않았다. 이는 BYOL이 벡터를 물리적으로 가깝게 정렬하기보다, '사망 예측' 과제에 최적화된 공유 잠재 공간을 형성했을 것으로 판단했다. 즉, 복잡한 멀티모달 환경에서는 벡터 공간의 근접성이 반드시 성능 향상으로 이어지지 않을 수 있다는 점을 발견했다. 결론적으로 이번 연구는 임상 데이터 특성에 맞는 학습 전략의 필요성을 제기했으며, 향후 각 모달리티의 고유성은 보존하며 공유 공간에서 시너지를 내는 모델로 연구를 고도화할 계획이다.#1. 단일 모달리티로만 학습했을 때의 성능도 비교해보았나요?답변: 포스터에는 나와있지 않지만, 단일 모달리티(시계열 EHR, 임상 노트) 각각으로 성능 측정 해보았습니다. 그 결과 단일 모달을 사용했을 때의 예측 성능보다 멀티 모달을 사용했을 때의 예측 성능이 더 좋게 나왔던 것을 확인했습니다.#2. Negative 샘플을 사용하지 않는 점이 임상 데이터에서 중요한 이유가 무엇인가요?답변: 이번 연구의 멀티모달 학습 과정에서는 같은 환자의 두 모달리티 데이터(EHR과 임상노트)를 Positive 페어로 사용하기 때문입니다. Negative 샘플을 사용하지 않음으로써, 상태가 유사한 다른 환자들을 Negative로 잘못 판단하여 서로 밀어내는 False Negative 문제를 피할 수 있어, 샘플 간 경계가 모호한 임상 데이터 환경에서 중요합니다.[청취 후기]1. 공간 빅데이터 통합 의사결정 지원 AI 플랫폼 및 활용 사례화이트 스캔의 기술 발표는 사이버 보안 분석에서 출발하여 이동, 소비 등 다양한 공간 데이터를 융합해 인구 밀집도를 예측하는 기술로 발전하며 데이터로 더 안전한 세상을 만드는 비전을 현실화하는 과정을 인상 깊게 보여주었다. 특히 이태원 참사를 계기로 재난 예방의 핵심 기술로 부상하여, 디지털 트윈 기반 시뮬레이션으로 최적의 안전 정책을 수립하고 XR 기기로 현장과 소통하는 등 미래형 재난 대응 시스템의 가능성을 제시했다. 또한, 복잡한 기술을 실제 정책 결정자가 효과적으로 사용하도록 지원하는 과정의 중요성을 강조하며, 결국 기술의 발전 방향은 사람을 향해야 한다는 근본적인 원칙을 다시 한번 일깨워준 의미 있는 시간이었다.2. 산업계가 바라본 인공지능과 인재양성 방안기업들이 AI 활용 능력을 갖춘 도메인 전문가(시니어)를 선호하게 되면서 신입 개발자의 입지가 좁아지는 현상과, 이것이 장기적으로 산업 경쟁력 약화로 이어질 수 있다는 딜레마를 지적한 부분이 인상 깊었다. 대학의 AI 융합학과들이 유행처럼 번지고 있지만, 근본적인 혁신을 이끌 핵심 인재와 산업 현장의 문제를 해결할 융합 인재를 구분하여 맞춤형 교육 로드맵을 설계해야 한다는 의견이 흥미로웠다. 건강한 인공지능 산업의 선순환 고리를 만들기 위해서 산업계의 목소리를 교육에 어떻게 녹여낼 것인지, 그리고 해외로 떠나는 인재들을 어떻게 붙잡을 것인지에 대한 현실적인 고민이 우리 모두에게 주어진 과제임을 다시 한번 느끼게 되었다.
Reviewed by 박현우 박현우
2025.09.02
Read More
02
2025.09

2025 한국데이터마이닝학회 추계학술대회 - 조용수

[학회 후기]석사 과정 중 연구실 단위로 참석하는 마지막 학회가 될 2025 한국데이터마이닝학회 하계학술대회에 참가했다. 평창이라는 도시가 주는 기대감은 5도 낮은 기온이 충분히 충족시켜줬다고 생각한다. 알펜시아 리조트에서 이루어진 학회는 여러 연사 분들의 강연으로부터 시작되었고, 지난 해 추계 학회와 마찬가지로 많은 연구원들의 포스터 세션이 이뤄졌다. 항상 학회에 오면 다들 열의를 가지고 학회를 참석하는 모습이 나에게 영감을 준다. 나 역시 "반도체 제조자원 정보를 활용한 계층적 딥러닝 방식의 수율예측" 이라는 주제로 포스터 발표를 진행했다. 1시간 반동안 진행되는 포스터 세션인데 분야가 너무 세부적이어서 청중의 관심이 크지 않을 것이라 생각했는데 다양한 연구원들이 실험 결과의 세부적인 내용까지 질문을 해줘서 이러한 연구를 했다는 데 자부심마저 들었다. 작년에는 비교적 부족한 연구 내용이었다면 이번에는 어느정도 결과가 나온 상황이라서 더 자신감 있게 답할 수 있었다고 생각한다. 다만 분야별로 세션 및 시간이 분배되어있어 관련된 제조 분야의 다른 포스터 발표를 자세히 볼 시간이 부족한 점은 조금 아쉬웠다. [발표 후기]주제: "반도체 제조자원 정보를 활용한 계층적 딥러닝 방식의 수율예측" 현대 산업의 급속한 발전은 반도체 공정의 미세화를 가속시키고 있다. 이로 인해 개별 공정의 복잡성과 공정 사이의 상호 작용이 크게 증가하였다. 기존의 수작업 기반의 분석이나 계측 데이터에 의존한 머신러닝 기법에 기반하는 경우, 시간과 자원이 많이소모되며, 이러한 상호 작용이 반영되기 어렵다는 한계가 있다. 이러한 문제를 해결하기 위해, 본 연구는 수치형 계측 데이터 없이 공정 진행 데이터만을 활용하여 웨이퍼 수율을 예측하는 계층적 딥러닝 접근법을 제안한다. 제안된 방법은 장비(equipment), 챔버(chamber), 레시피(recipe), 마스크(mask)의 네 가지 핵심 공정 조건을 기반으로, 조건(condition), 공정(process), 상호작용(interaction)의 세 가지 수준에서 수율을 예측한다. 이 과정에서 제조 흐름의 시간적 특성을 포착하기 위해 gated recurrentunit(GRU)을 사용하고, 공정 단계 간의 중요도를 학습하기 위해 어텐션 메커니즘을 도입하였다. 실제 한국의 반도체 생산 공장에서 수집된 데이터에서 실험이 진행되었으며, 제안된 방식은 기존 방법들에 비해 예측 정확도 및 강건성 측면에서 향상된 성능을 보였다. 이러한 결과는 복잡한 제조 현장에서 의사결정을 지원하는 데 있어, 제안된 방법이 효과적인 방법으로 활용될 수 있음을 시사한다.#1질문. End to End 방식으로 설계되지 않은 점이 의아하다.답변: 개별 모델의 성능차이가 있는 데 End to End 방식으로 학습할 경우 전반적으로 유리한 Process 모델을 중점으로 학습되어 저수율, 고수율 영역에서 더 효과적인 Condition, Interaction 모델은 효과적으로 학습이 되지 않았다. 그래서 학습을 별도로 진행하였다.#2질문. 도메인 지식이 필요한 모델인가?답변. 도메인 지식을 반영하여 추가적인 피쳐 엔지니어링 및 모듈화를 활용해 유사한 아키텍쳐로 구현한 기존 연구는 존재한다. 하지만 현재 계속해서 고도화 되고 있는 공정은 도메인 엔지니어도 모든 의존성을 파악하지 못한다. 그래서 Data Driven 방식으로 구현하였기 때문에, 도메인 지식이 크게 필요하지않다.[청취 후기]1. Continual Self-Supervised learning for Skeleton-based Human Action Recognition (안시후 / 고려대학교)새로운 행동 패턴이 계속 발생하는 상황 때문에 기존에 학습한 지식을 최대한 유지하면서 효과적으로 새로운 행동을 학습하기 위해 Continual 이용함과 동시에자기 지도 학습을 통해 행동에 대한 학습을 효과적으로 진행하여 새로운 행동 데이터에 대한 인식 정확도와 적응 능력에서 일관된 좋은성능이 확인되었다.그런데 생각보다 전체적인 성능이 좋지 않은 부분이 있다보니 이전 연구 및 개선 연구에서의 성능 확인이 되었지만 앞으로도 발전 가능성이 많다고 생각했다. 2: Generative AI for Causal Reasoning: Foundation and Algorithms (임성빈 / 고려대학교)Causal Reasoning이라는 주제를 생성형 모델과 접목시켜 연구하는 최근의 흐름에 대해 다룬 강연이었다. 발표에서는 LLM을 활용하여 Causal Reasoning 문제를 다루는 다양한 방법론이 소개되었는데, 이를 통해 얻은 답변이 과연 학습된 지식을 활용한 것인지, 혹은 단순히 가능성 있는 결과를 만든 건지 판단이 어려운 문제가 존재한다는 점이 인상 깊었다.이러한 문제를 해결하기 위해 Diffusion 모델을 활용하는 활발히 이뤄지고 있는데 Diffusion 모델은 실제 데이터의 분포를 파악하기는 어렵지만, Score 분포를 추정하는 데 유리하여 이를 활용하여 Causal Reasoning 문제를 풀어가는 연구가 활발히 진행되고 있다는 점이 인상적이었다.  앞으로 해당 분야가 더욱 발전해 나갈 수 있을 것이라는 기대감을 가지게 되었다. 전체적으로 발표 스타일이 흥미로워서집중하면서 본 강연이었다.
Reviewed by 조용수 조용수
2025.09.02
Read More
02
2025.09

2025 한국데이터마이닝학회 하계학술대회 - 이혜승

[학회 후기]2025년 여름, 한국데이터마이닝학회 하계학술대회가 평창에서 개최되었다. 서울의 더운 공기를 뒤로하고 도착한 평창은 선선한 바람이 불어와 학회장 분위기를 한층 여유롭고 쾌적하게 만들어 주었다. 이런 날씨 덕분에 학회에 집중할 수 있었고, 발표자와 청중 모두 활발하게 교류하는 모습이 인상적이었다.이번 학회는 나에게 특히 뜻깊었다. 처음으로 좌장을 맡게 되었기 때문이다. 발표자들의 연구를 소개하고 세션을 진행해야 한다는 책임감 때문에 학회에 가는 길 내내 긴장과 설렘이 교차했다. 실제로 마이크를 잡는 순간에는 조금 떨렸지만, 발표자분들의 차분한 진행과 청중들의 적극적인 호응 덕분에 점차 마음을 가다듬을 수 있었다. 좌장으로서 세션을 이끌며 단순히 듣는 입장이 아니라 학회를 함께 만들어간다는 경험을 할 수 있었던 것이 무척 의미 있게 다가왔다.또한 구두 발표와 포스터 세션에서 다양한 최신 연구들을 접할 수 있었는데, 특히 시계열 이상탐지, 생성형 AI, 인과추론 등 여러 주제가 서로 연결되며 발전해 나가는 흐름을 느낄 수 있었다. 내 발표뿐만 아니라 다른 연구자들과 자유롭게 토론하며 아이디어를 교환하는 시간이 많았다는 점도 좋았다. 무엇보다 이번 학회는 연구자로서뿐 아니라 학회 구성원으로서의 또 다른 역할을 경험하게 해준 자리였다. 선선한 평창의 공기 속에서 새로운 도전을 마주하고, 동료 연구자들과 함께 성장할 수 있었던 시간이었다.[발표 후기]발표 주제: Prototype Alignment: A Semi-Supervised Framework for Instance Segmentation of Crops이번 학회에서 발표한 연구는 작물 이미지를 대상으로 한 인스턴스 분할(instance segmentation) 기법에 관한 것이었다. 농업 분야에서는 개체별 작물의 생육 상태, 수량, 병충해 여부를 정밀하게 모니터링하는 기술이 중요하지만, 잎의 복잡한 구조와 겹침 때문에 라벨링 과정이 어렵고 비용이 많이 든다는 한계가 있다. 이러한 문제의식을 바탕으로, 나는 foundation model인 FastSAM을 농업 이미지에 특화되도록 finetuning하고, 준지도 학습(semi-supervised learning) 방식을 적용하여 레이블 부족 문제를 완화하는 방법을 제안하였다.제안한 방법론의 핵심은 크게 두 가지였다. FastSAM 파인튜닝을 통해 원래 모델이 과도하게 분할하던 잎 영역을 실제 개체와 유사하게 안정적으로 인식하도록 개선하였다. 프로토타입 정렬 기반 준지도 학습(Prototype Alignment) 기법을 도입하여 소량의 레이블과 다량의 비라벨 데이터를 함께 활용하였다. 동일한 비라벨 이미지에 서로 다른 증강을 적용했을 때, 두 결과가 일관된 표현을 갖도록 유도함으로써 모델이 더 안정적이고 일반화된 표현을 학습할 수 있도록 했다발표를 진행하며 왜 이 모델을 선택하게 되었는지, 그리고 증강 기법이 성능에 미치는 영향 등 다양한 질문을 받았다.이러한 질의응답은 연구의 보완점과 확장 가능성을 구체적으로 고민해볼 수 있는 계기가 되었다. 이번 발표는 단순히 실험 결과를 공유하는 자리를 넘어, 연구의 방향성을 점검하고 새로운 아이디어를 얻을 수 있었던 뜻깊은 경험이었다.[청취 후기]1. 멀티 에이전트 기반 대형 언어모델을 활용한 해석 가능한 시계열 이상탐지 (포스터 발표)이번 포스터 발표는 시계열 이상탐지를 멀티모달 방식으로 풀어낸 점이 특히 인상 깊었다. 단순히 수치형 데이터만 다루는 것이 아니라, 시계열 패턴을 자연어로 서술한 설명과 시계열 데이터를 이미지 형태로 변환한 입력을 동시에 LLM에 제공한다는 점이 흥미로웠다. 이를 기반으로 LLM은 보통 시계열 분석에서 활용되는 seasonal, trend 등 요소별 분석을 수행하는 에이전트 역할을 따로 두어 데이터를 다각도로 해석하였다. 마지막에는 각 분석 결과를 종합해 이상치 여부와 그 의미를 설명하는 의견을 생성하는 구조를 갖추고 있었는데, 기존 시계열 탐지 연구에서는 보기 힘든 새로운 접근이라 신선하게 다가왔다. 역시 요즘 멀티 에이전트가 뜨거운 주제라는 점을 다시 한번 실감할 수 있었고, 나 또한 관심을 갖고 공부해 나가는 분야라 더욱 의미 있게 다가왔다. 이번 학회에서 접한 다양한 관련 포스터들을 통해 시각을 넓히고 새로운 아이디어를 얻을 수 있었던 값진 경험이었다.2. Generative AI for Causal Reasoning (세션3)이 발표에서는 생성형 AI와 인과추론의 접목이 핵심 주제였다. 단순히 데이터를 학습해 패턴을 찾는 머신러닝을 넘어, “왜 그런 결과가 나타나는가?”라는 인과적 질문을 다루는 것이 중요하다는 점을 강조했다. 특히, 머신러닝이 주어진 문제 해결에 초점을 맞춘다면, 머신 리즈닝(Machine Reasoning)은 지식과 데이터를 활용해 새로운 질문에 답하는 과정으로 확장된다는 설명이 흥미로웠다. AI가 단순 예측에서 벗어나 과학적 발견과 정책 결정 지원으로 이어질 수 있다는 전망을 들으며, 앞으로 데이터 분석 연구에서도 인과적 해석과 생성형 모델의 융합이 핵심이 될 것이라 느꼈다.
Reviewed by 이혜승 이혜승
2025.09.02
Read More
02
2025.09

2025 한국데이터마이닝학회 하계학술대회 - 박소연

[학회 후기]2025년 여름, 한국데이터마이닝학회 하계학술대회가 평창 알펜시아 리조트에서 개최되었다. 선선한 날씨 덕분에 학회 분위기는 한층 더 여유로웠고, 동시에 많은 연구자들이 모여 활발한 교류가 이루어졌다. 이번 하계학술대회에서도 다양한 발표가 준비되어 있었는데, 특히 시계열 이상탐지, 생성형 AI, 강화학습 등 최근의 연구 트렌드를 반영한 주제들이 눈에 띄었다.나 또한 포스터 발표자로 참여해 내 연구를 소개할 수 있었는데, 여러 연구자들과 질의응답을 나누면서 새로운 관점에서 내 연구를 돌아보는 계기가 되었다. 다른 발표자들의 연구를 보면서 이 아이디어를 내 주제에도 접목해볼 수 있겠다는 생각이 들기도 했고, 다양한 분야에서 인공지능이 응용되는 사례들을 접하며 신선한 자극을 받을 수 있었다.[발표 후기]발표 주제: Online Test-time Adaptation for CLIP under Continual Domain Shifts이번에 발표한 주제는 CLIP 모델을 대상으로 한 Online Test-time Adaptation 방법론이었다. CLIP이 제로샷 분류에서 강력한 성능을 보이지만, 도메인 변화가 지속적으로 발생하는 현실 환경에서는 일반화 성능이 급격히 저하된다는 문제의식에서 출발했다. 이를 해결하기 위해 모델 파라미터가 아닌 입력 프롬프트만을 실시간으로 조정하는 경량화된 적응 방식, 적응된 프롬프트를 저장하는 메모리 구조, 그리고 메모리 다양성을 높이는 주기적 최적화를 결합한 방법을 제안하였다. 실험 결과, 반복적인 도메인 변화 상황에서도 기존 방법 대비 안정적이고 향상된 성능을 확인할 수 있었다.발표를 준비하면서 내가 제안한 방법의 핵심 기여를 어떻게 명확히 전달할지 고민했는데, 내 포스터 발표를 들으러 찾아와준 많은 연구자분들께서 특히 프롬프트 메모리 구조와 다양성 확보 전략에 많은 관심을 보여주셔서 뿌듯했다. 여러 질문을 통해 내 연구의 한계를 돌아보고 보완할 점도 확인할 수 있었으며, 동시에 새로운 아이디어도 얻을 수 있었다. 이번 발표는 내 연구를 정리하고 피드백을 받을 수 있는 뜻깊은 기회였다고 생각한다. [청취 후기]1. 멀티 에이전트 기반 대형 언어모델을 활용한 해석 가능한 시계열 이상탐지 기술 연구해당 포스터 발표에서는 소개된 연구는 기존 시계열 이상탐지 기법이 갖고 있던 해석력 부족과 단일 모델 의존성 문제를 해결하기 위한 새로운 접근이었다. 특히, LLM을 단일 분석기로 활용하는 것이 아니라, 다양한 통계적·구조적·시각적 분석 도구를 호출할 수 있는 멀티 에이전트 프레임워크를 설계했다는 점이 인상 깊었다. 각 에이전트가 부분적인 분석을 수행하고, 이를 오케스트레이션 에이전트가 통합한 뒤 LLM이 사람이 이해하기 쉬운 설명 문장을 생성한다는 아이디어는 산업 현장에서의 실질적 활용 가능성을 높여준다고 생각된다.또한 단순히 이상 여부를 탐지하는 데 그치지 않고, 원인–패턴–영향 간 관계를 정량적으로 규명하고 이를 직관적으로 해석할 수 있다는 점이 기존 연구와의 차별점으로 느껴졌다. 발표를 들으며, LLM이 단순 질의응답을 넘어 시계열 분석 맥락에서 어떻게 해석력을 강화할 수 있는지에 대한 가능성을 확인할 수 있었고, 앞으로 다양한 산업 도메인에서 확장 적용될 수 있을거라고 생각했다.
Reviewed by 박소연 박소연
2025.09.02
Read More
02
2025.09

2025 한국데이터마이닝학회 하계학술대회 - 조한샘

[학회후기]이번 한국데이터마이닝학회 하계학술대회는 평창에서 개최되었다. 최근 학회의 구성과 주제가 점점 다양해지면서 매번 흥미롭고 기대되는 학회로 자리 잡고 있다. 이번 학회는 구두 발표와 포스터 세션으로 나뉘어 진행되었는데, 특히 구두 발표에서는 교수님들께서 직접 과거 연구, 현재 진행 중인 연구, 그리고 향후 연구 방향성까지 일관된 흐름으로 발표해 주신 점이 인상 깊었다. 또한 다양한 학생들의 포스터 발표를 통해 자유롭게 토론하고 의견을 나눌 수 있어 매우 의미 있는 시간이었다.[발표후기]제목: Golden Noise를 통한 Diffusion Model 기반 Conditional Generation 개선발표후기: 이번에 표한 주제는 diffusion 모델 기반 conditional generation에서의 golden noise 활용에 관한 연구였다. Golden noise란 다른 노이즈에 비해 더 좋은 퀄리티의 이미지를 생성할 수 있는 노이즈를 의미한다. 기존 연구들은 image generation 상황에서 golden noise를 탐구하는 데 그쳤지만, 본 연구에서는 이를 controllable generation 상황으로 확장하였다. 우선 파일럿 스터디를 통해 controllable generation 환경에서도 golden noise가 존재함을 확인하였다. 이후 inversion을 활용해 golden noise를 찾는 기법을 제안했으나, 손상된 이미지에 inversion을 적용하는 과정에서 찾은 노이즈가 Gaussian 분포에서 멀어지는 한계가 있었다. 이를 보완하기 위해 추가적인 control term을 도입하여 inversion을 수행했으며, 그 결과 단순 inversion 기반 노이즈 탐색에 비해 더욱 깔끔한 이미지를 생성할 수 있었다. 다만, 정량적 결과에서는 전반적으로 최고 성능을 달성하지 못해 향후 보완 연구가 필요하다. 발표에 많은 분들이 관심을 가지고 질문해 주셔서 연구를 점검하고 새로운 아이디어를 얻는 의미 있는 시간이었다.[청취후기]1. 물류 시스템 최적화를 위한 AI 기반 알고리즘카이스트 권창현 교수님의 발표에서는 인공지능을 활용한 조합 최적화 문제 해결 기법이 소개되었다. 예전부터 개인적으로 관심이 많았던 주제라 흥미롭게 들을 수 있었다. 현재는 주로 routing problem에 대한 해결책을 탐구하고 있으며, 장기적으로는 다양한 조합 최적화 문제를 아우를 수 있는 foundation model을 구축하는 것을 목표로 하고 있다고 한다. 과거 연구에서부터 현재, 그리고 향후 연구 방향성까지 자연스럽게 이어지는 발표의 흐름이 인상적이었다.2. Generative AI for Causal Reasoning: Foundation and Algorithms이 발표에서는 LLM을 기반으로 causal graph를 탐색하는 연구가 소개되었다. 단순히 LLM만을 사용하는 방식은 prior 부족으로 정확도가 떨어지는데, 이를 해결하기 위해 diffusion 모델을 활용하여 prior를 보완하는 방법이 제안되었다. Diffusion 모델은 score를 예측할 수 있다는 장점이 있어 이를 causal graph 탐색의 prior로 활용할 수 있었다. 평소 diffusion 모델을 연구하는 입장에서, 이러한 모델이 causal reasoning 분야에도 응용될 수 있다는 점이 무척 흥미로웠다.
Reviewed by 조한샘 조한샘
2025.09.02
Read More
02
2025.09

2025 한국데이터마이닝학회 하계학술대회 - 안시후

2025년 8월 28일부터 이틀 간 평창 알펜시아 리조트에서 한국데이터마이닝학회 하계학술대회가 열렸다. 학회장 주변에 도착했을 때 눈이 없는 스키장은 어색했지만 선선한 날씨에 습도가 낮아 기분이 좋았다. 작년에 이어 올해도 다양한 연구들을 포스터로 접할 수 있었고 나 또한 포스터를 만들어 발표를 하였다. 대체로 포스터 발표는 간단히 핵심을 설명하고 질문을 받는 과정으로 진행되었던 것 같다. 이 과정에서 사람들이 궁금해 하는 내 연구에 대한 생각도 해보고 어떤 부분에서 설명이 막히는지 등 다양한 경험을 할 수 있었다. 뿐만 아니라 매일 보는 연구가 아닌 다른 연구들을 접하게 되면서 이걸 이렇게 내 연구에 적용해보면 어떨까 하는 생각도 해보면서 학회를 즐겼고 오랜만에 보는 반가운 얼굴이 많아 의미있는 시간을 보낼 수 있었다.이번 학회에서 Continual Self-Supervised learning for Skeleton-based Human Action Recognition을 주제로 발표를 진행하였다. Action recognition의 현실적 한계점 1.행동의 다양성으로 인해 모델 업데이트가 필요하다. 2.행동 영상 특히 skeleton 데이터로 이루어진 영상을 보고 레이블링을 하는 것은 어렵다. 두 가지를 다루고자 하였으며 각각 continual learning과 self-supervised learning을 이용하여 개선을 하고자 하였다. 이미 이 두 방식을 활용하는 continual self-supervised learning의 경우 이미지를 비롯한 몇몇 분야에서 활용되고 있다. Continual self-supervised learning을 skeleton-based action recognition에 적용하기 위해 ST-GCN 백본과 skeleton에 알맞은 augmentation 기법을 적용하였으며 기존 지식을 보존하기 위한 distillation 기법 또한 효과가 있는 것을 확인하였다. 포스터에 담지는 못 하였지만 ST-GCN에서 polling 하기 전 feature map에서 skeleton 좌표 및 bone에 대한 차이를 계산하여 distillation 연산에 추가 적용하였을 때 성능이 개선되는 효과를 얻어 발표 시 함께 설명하였다.질문 1. Skeleton을 어떻게 구해서 활용했나요?답변 1. NTU-RGB+D 데이터에 포함된 skeleton 데이터를 이용했습니다. 만약 이미지 영상만 있는 데이터라면 사전 학습된 pose estimation model인 openpose, mediapipe 등을 활용해서 skeleton을 구할 수 있습니다.질문 2. Continual learning 과정에서 이전 데이터 정보를 잊게 되는 문제가 발생할텐데 어떻게 보존하나요?답변 2. Distillation 기법을 이용하여 이전 데이터로 학습된 task의 model을 현재 데이터 학습 중 teacher model로 설정하여 파라미터를 고정한 뒤 현재 학습 중인 모델을 업데이트 할 때 teacher model로 추론된 샘플과 비교하는 loss를 추가하여 이전 정보를 잊게 되는 현상을 방지할 수 있었습니다.다양한 발표를 들을 수 있었는데 기억에 남는 몇 가지가 있었다.1. Aligning Normalizing Flow to Mitigate Spurious Forgetting in Continual Anomaly Detection (임훈, 서울대학교)이상치 탐지를 위한 continual leaning을 할 때 일시적인 성능 하락 현상인 spurious forgetting 현상에 대해서 확인하고 이를 해결하기 위한 정렬 기반 접근법을 제안하였다. 모델 업데이트 과정 중 기존 지식을 잊는 현상인 catastrophic forgetting과 다르게 spurious forgetting은 성능이 돌아오지만 일시적으로 성능이 하락하여 잘 못 모델을 선택할 위험성을 방지하고자 하는 것으로 이해하였다. Spurious forgetting라는 용어에 대해서 처음 접하게 되어 자세히 살펴볼 필요성을 느꼈다.2. AI시대 대학의 역할 (조성준, 서울대학교)요즘 인공지능이 발전하면서 모든 학교에서 인공지능을 어떻게 활용하고 적용할지에 대한 고민이 깊다. 일각에서는 과제를 할 때 인공지능을 활용하지 말라고 하는 등 제재를 주는 경우도 존재한다. 이러한 방향 보다는 잘 활용할 수 있도록 이끄는 것이 맞지 않을까? 라는 이야기를 해주셨다. 인공지능의 답변은 틀릴 수 있기 때문에 검수 하는 능력이 필수라고 느꼈고, 이를 위해서는 오히려 많은 것을 알고 있어야 한다고 느꼈다. 문맹의 기준을 나눌 때 옛날에는 글을 읽지 못 하는 것이 기준이었다면, 최근까지는 검색을 할 줄 모르는 것이 기준이라고 생각하였는데, 앞으로는 인공지능을 잘 활용할 수 있는 것에 따라 나뉘는 시대가 오지 않을까 생각하게 되었다.
Reviewed by 안시후 안시후
2025.09.02
Read More
02
2025.09

2025 한국데이터마이닝학회 하계학술대회 - 최지형

[학회 후기]2025년 8월 28~29일 강원도 평창 알펜시아에서 열린 한국데이터마이닝학회 하계학술대회에 참가하였다. 이번 학회는 구두 발표 세션과 포스터 발표 세션이 병행되었으며, 작년보다 참가자와 발표 수가 눈에 띄게 늘었다. 특히 포스터 세션에서는 다양한 연구자들과 직접 토론할 수 있었고, 그 과정에서 여러 의견과 피드백을 교류할 수 있었다. 올해는 대규모 언어 모델(LLM)을 다루는 연구가 크게 증가했으며, 인문·사회과학적 개념을 접목한 시도도 일부 눈에 띄었다. 이를 통해 학계의 전반적인 연구 흐름을 확인할 수 있었고, 앞으로의 연구 방향을 고민하는 데 참고가 되었다. 종합적으로, 연구 교류와 네트워킹을 통해 얻은 경험이 유익했으며, 연구 트렌드를 파악하는 좋은 기회였다.[발표 후기]주제: Semi-Supervised Analytic Federated Learning (SS-AFL)본 연구에서는 labels-at-server 시나리오에서의 federated semi-supervised learning (FSSL) 문제를 다루었다. 기존 방법들은 서버는 소량의 라벨 데이터로 학습하고, 클라이언트는 pseudo-label을 기반으로 학습을 수행한다. 하지만 이 경우 client drift(비라벨 데이터 기반 학습으로 인한 전역 방향성과의 괴리)와 supervision forgetting(라벨 신호의 점진적 소실) 문제가 발생한다. 이를 해결하기 위해 본 연구에서는 analytic learning(폐형 해 기반 학습)을 FSSL에 통합한 SS-AFL 프레임워크를 제안하였다. 핵심은 SS-AA Law라 불리는 partitioned Moore–Penrose inverse 기반의 통합 규칙으로, 서버와 클라이언트에서 각각 학습된 analytic head를 수학적으로 일관된 방식으로 집계하는 것이다. 실험 결과, CIFAR-10/100, SVHN 벤치마크에서 기존 FSSL 방법보다 더 높은 정확도와 안정적인 성능을 달성하였다. 포스터 발표에서는 pseudo-label 품질 관리와 analytic aggregation을 통한 안정성 확보라는 두 가지 측면에서 연구 필요성을 강조할 수 있었고, 여러 연구자들과 유의미한 논의를 나눌 수 있었다.질문 1: Analytic learning을 통합하셨다고 했는데, gradient-based 업데이트 방식보다 어떤 이점이 있나요?답변 1: analytic learning은 폐형 해를 통해 head parameter를 한 번에 계산하므로, 반복적인 local optimization 과정에서 발생하는 client drift를 줄여줍니다. 즉, 각 클라이언트의 업데이트가 방향성에서 크게 벗어나지 않게 하고, 서버-클라이언트 간 라벨/비라벨 분리 구조에서도 일관성 있는 통합이 가능해집니다.질문 2: SS-AA Law에서 partitioned Moore–Penrose inverse를 사용한 이유가 있나요?답변 2: 서버와 클라이언트 head는 서로 다른 데이터 분포(라벨 vs 비라벨)에 기반해 학습되므로 단순 평균(FedAvg)으로는 결합이 불안정합니다. Moore–Penrose inverse를 활용하면 feature space에서의 least-squares optimal solution을 구할 수 있고, partition 구조를 통해 서버-클라이언트 supervision을 균형 있게 반영할 수 있습니다.[청취 후기]1. ReactionReasoner: Reasoning LLM for Chemical Reaction Prediction이 연구는 대형 언어모델(LLM)을 활용하여 단순히 화학 반응의 결과만 예측하는 것을 넘어, 왜 그런 결과가 나오는지까지 설명할 수 있도록 설계한 점이 인상적이었다. 지금까지의 화학 반응 예측 모델은 결과 예측에만 집중했지만, ReactionReasoner는 반응 과정을 추론적으로 기술해 연구자들이 반응 메커니즘을 이해하는 데 도움을 준다. 단순한 예측을 넘어 새로운 화학적 현상을 밝히는 실마리를 제공할 수 있다는 점에서 의미 있는 시도로 느껴졌다. 2. Continual Self-Supervised Learning for Skeleton-based Human Action Recognition이 연구는 행동 인식 분야에서 발생하는 catastrophic forgetting 문제를 해결하기 위해 자기지도학습 기반의 지속적 학습 프레임워크(CSSL-S)를 확장한 것이다. Spatial-Temporal Graph Convolutional Network(ST-GCN)을 적용해 시공간적 관계를 효과적으로 모델링하고, 라벨 없이도 강력한 표현을 학습할 수 있도록 했다. 새로운 행동 데이터를 학습하면서도 기존 지식을 안정적으로 유지하는 접근은 실제 응용 가능성이 높아 보였다. 발표를 들으면서 CSSL에 특화된 loss를 추가하면 더욱 강력한 방법이 될 수 있겠다는 생각이 들었다.
Reviewed by 최지형 최지형
2025.09.02
Read More