2024 한국데이터마이닝학회 추계학술대회 - 김정인
- 2024년 11월 25일 오전 11:24
- 조회수: 166
Reviewed by
김정인

# 학회 후기
2024년 11월 22~23일 경주 화백컨벤션센터에서 열린 한국 데이터마이닝학회 추계학술대회에 포스터 발표자로 참가했다. 연구실 전원이 함께 참석한 학회였기에 더욱 뜻깊었고, 개인적으로도 첫 포스터 발표라 더욱 의미 있는 경험이었다. 학회를 통해 최근 산업에서 어떤 연구가 주로 이루어지고 있는지 알 수 있었고, 최신 연구 동향을 접할 수 있어 매우 유익했다. 포스터 발표 섹션에서는 다양한 연구가 발표되었는데, 특히 거대 언어 모델과 생성 모델의 높은 인기를 확인할 수 있었다. 이번 경험을 계기로 앞으로도 학회에 더 많이 참석하고 싶다는 생각이 들었다.
# 발표 후기
주제: 데이터 효율성 개선을 위한 역학 모델 기반 멀티 에이전트 강화학습
내 연구는 강화학습의 고질적인 문제 중 하나인 샘플 효율성을 개선하기 위해, 다중 에이전트 강화학습에서 표현 학습을 결합하는 방법을 제안한 것이다. 특히 표현 학습을 통해 환경의 역학을 이해하는 데 도움을 주는 역학 모델을 활용했다. 이번 포스터 발표 중, 강화학습에 익숙하지 않은 분들이나 학습을 시작한 지 얼마 되지 않은 분들과의 대화가 많았다. 따라서 강화학습이 무엇인지부터 시작해 내 연구의 목적과 목표를 설명하는 데 많은 시간을 들였다. 때로는 "어렵다"는 반응에 30분 이상 붙잡고 질문을 받으며 최대한 이해를 돕고자 했다. 비록 짧은 시간에 강화학습의 모든 동작 원리를 설명하기는 어려웠지만, 연구의 큰 흐름만큼은 이해시키고자 노력했다. 특히 스티커를 하나 받을 때 연구에 대한 관심을 이끌어냈다는 작은 성취감을 느낄 수 있었다.
- 주고받은 질문
질문 1: 단일과 다중 에이전트 강화학습이 무엇인가요?
답변 1: 단일과 다중 에이전트 강화학습의 가장 큰 차이는 학습 대상 에이전트의 수입니다. 단일 에이전트 강화학습은 하나의 에이전트가 환경과 상호작용하며 최적의 행동 정책을 학습하는 방법론이고, 다중 에이전트 강화학습은 두 개 이상의 에이전트가 상호작용하며 학습하는 방식입니다.
질문 2: 역학 모델이 무엇인가요?
답변 2: 역학 모델은 과거 시점에서의 에이전트 정보(주변 환경 정보와 행동 정보)와 전체 상태 정보를 바탕으로 미래 상태를 예측하는 모델입니다. 이를 통해 현재 행동이 미래에 미칠 영향을 예측할 수 있으며, 이는 환경의 역학을 이해하는 데 중요한 역할을 합니다.
# 청취 후기
다양한 주제에 대한 발표가 이루어졌는데, 그중 가장 기억에 남는 발표는 한양대학교 데이터사이언스학과 한경식 교수님이 발표한 "PREDICT: Multi-Agent-based Debate Simulation for Generalized Hate Speech Detection"에 관한 내용이었다. 이 주제에 대한 연구를 처음 접했기 때문에 더욱 관심을 갖고 집중해서 들을 수 있었다.
이 연구는 다중 에이전트 기반 접근법을 활용해 데이터셋 간 레이블링 기준 차이로 인해 발생하는 일반화 문제를 해결하고, 혐오 표현 탐지에서 높은 정확도와 일반화 성능을 달성한 사례를 보여주었다.
특히, PREDICT는 LLM(Large Language Model)을 기반으로 한 두 단계 접근 방식이 매우 흥미로웠다.
1. PRE(Perspective-Based Reasoning) 단계에서는 LLM이 각 데이터셋의 레이블링 기준에 따라 독립적인 관점을 형성하고, 주어진 텍스트에 대한 입장과 이유를 생성한다.
2. DICT(Debate using InCongruenT References) 단계에서는 에이전트들이 형성한 관점을 바탕으로 논쟁을 벌이며, 판사 역할을 하는 LLM이 논쟁 내용을 종합해 최종 결론을 도출한다.
이 과정에서 단순히 다수 의견에 의존하지 않고 소수 의견까지 반영하여 더욱 균형 잡힌 결정을 내리는 방식이 매우 인상적이었다. PREDICT는 다섯 개의 공개 혐오 표현 데이터셋(K-HATERS, K-MHaS, KOLD, KODORI, UnSmile)에서 실험되었으며, 다양한 데이터셋 간 레이블링 기준 차이를 효과적으로 중재하며 기존 방법론보다 뛰어난 일반화 성능을 입증했다. 이 연구는 단순한 기술적 텍스트 분류를 넘어, 언어의 사회적·문화적 맥락을 반영하려는 시도를 보여주었다. 혐오 표현과 같은 민감한 문제 해결에 중요한 진전을 이룩했을 뿐만 아니라, 다중 에이전트 기반 접근법이 다른 사회적 문제 해결에도 적용 가능성이 높음을 시사해 큰 영감을 받았다.
이번 데이터 마이닝 학회를 준비하느라 애쓰신 모든 연구원분들께 감사의 마음을 전하며, 또한 이런 소중한 기회를 제공해주신 교수님께도 고맙습니다.