[학회 후기]
2025년 7월 1일부터 4일까지 일본 기타큐슈에서 개최된 IEA/AIE 2025 학회에 다녀왔다. 지금까지 일본은 여러 차례 여행으로 방문한 적은 있었지만, 학회 참석을 위해 찾은 것은 이번이 처음이었다. 처음이라 다소 긴장도 되었지만, 동시에 새로운 도전에 대한 설렘으로 기대를 안고 학회장에 들어설 수 있었다.

IEA/AIE 학회는 International Conference on Industrial, Engineering & Other Applications of Applied Intelligent Systems의 약자로, 산업, 공학, 그리고 다양한 분야에서 지능형 시스템의 응용을 다루는 국제 학술대회이다. 이번 학회에서는 강화학습, 컴퓨터 비전, 거대 언어 모델(LLM) 등 다양한 연구 주제와 함께, 이러한 기술들의 실제 적용 가능성과 활용 사례를 중심으로 한 발표들이 이루어졌다. 세션은 총 3개의 방에서 동시에 진행되었고, 중간중간 특정 세션에서는 좌장이 직접 발표를 맡는 모습도 볼 수 있었다. 휴식 시간에는 커피를 마실 수 있는 공간이 마련되어 있었는데, 바다를 보며 잠시 쉴 수 있어 무척 인상 깊었다. 첫째 날에 등록을 마친 뒤, 학회장의 인사말로 일정이 시작되었다. 그동안 메일로만 소통하던 학회장을 실제로 만나니, 마치 연예인을 본 듯한 기분이 들었다. 학회장은 간단한 환영 인사와 함께 2026년 IEA/AIE 학회에 대한 소개와 참여 독려를 전했으며, 개막식과 폐막식 모두에서 이를 강조했던 것이 기억에 남았다. 가장 인상 깊었던 키노트 스피치에서는 데이터의 무분별한 사용에 대한 규제와 암호화 기술에 대한 내용이 다뤄졌다. 이를 통해 산업 현장에서는 데이터 활용에 대한 윤리적 고민과 기술적 대응이 중요한 이슈임을 다시금 느낄 수 있었다. 산업공학 전공자로서, 컴퓨터공학이나 인공지능 분야와는 또 다른 관점을 갖고 있음을 실감할 수 있었고, 기업에서 산업공학 박사에게 기대하는 역할에 대해서도 다시 한번 고민해보는 계기가 되었다. 국내 학회와 해외 학회를 비교했을 때 가장 큰 차이는 역시 언어와 참석자들이었다. 이번 경험은 나에게 큰 자극이 되었고, 앞으로 더 큰 규모의 학회에서 발표하며 더 다양한 사람들과 소통해보고 싶다는 생각이 들었다. 기회가 있다면 앞으로도 계속 도전하고 싶다.  

[발표 후기 - DynaMIX: Sample-Efficient Multi Agent Reinforcement Learning with Multi-Step Temporal Forward Dynamics Modeling] 
이번 학회에서는 다중 에이전트 강화학습 방법론 중 널리 사용되는 QMIX에 forward dynamics modeling 기반의 표현 학습을 보조 작업으로 사용하여 샘플 효율성을 개선한 연구를 발표했다. 강화학습은 최적의 정책을 학습하기 위해서 많은 시간과 비용이 소요된다는 고질적인 한계가 있으며, 이를 개선하기 위한 다양한 접근법이 존재한다. 그중 하나인 표현 학습을 보조 작업으로 사용하는 접근법을 개인 연구에 적용하였다. 실험은 SMAC 환경에서 진행했으며, 두 가지 어려운 시나리오와 한 가지 매우 어려운 시나리오를 통해, 제안한 방법이 기존 대비 샘플 효율성을 개선함을 실증적으로 입증할 수 있었다. 발표를 마친 뒤 세션 좌장께서 "인상적인 연구였다"고 평가해주어 내심 뿌듯했으며, 처음으로 다양한 국적을 가진 사람들 앞에서 영어로 발표하고 질의응답까지 무사히 해냈다는 점에서 큰 성취감을 느낄 수 있었다. 

질문 1) 에이전트가 페널티를 받을 때는 언제인가요? 
답변 1) 에이전트가 특정 상황에서 잘못된 행동을 선택했을 때, 환경으로부터 페널티를 받습니다. 

질문 2) SMAC의 여러 시나리오의 난이도는 에이전트의 수에 의해 결정이 되는 것인가요?
답변 2) 아니요. SMAC의 난이도는 에이전트 수가 아니라, 다양한 MARL 알고리즘을 적용한 실험 결과를 기준으로 분류됩니다. 여러 알고리즘이 모두 낮은 성는을 보이면 해당 시나리오는 "매우 어려움"으로, 일부 알고리즘이 높은 성능을 보이면 "쉬움" 혹은 "어려움"으로 분류됩니다. 

[청취 후기 ① - A Reinforcement Learning Based Framework to the Facility Layout Problem] 
해당 발표는 산업 환경에서 강화학습을 어떻게 실제로 활용할 수 있는지를 잘 보여주는 흥미로운 사례였다. 기존에는 전문가가 수작업으로 해결하던 공장 레이아웃 문제를, 누구나 GUI를 통해 쉽게 정의하고 강화학습을 통해 최적화할 수 있도록 한 점이 특히 인상 깊었다. 실제로도 다양한 제약 조건과 목적 함수를 반영해 레이아웃을 자동으로 생성하는 결과를 보여줬고, 실험적으로 강화학습의 적용 가능성을 잘 증명해주었다. 강화학습이 실무에 활용되기 어려웠던 기존 한계를 낮춘 점에서, 학문적 의미뿐 아니라 실용성 측면에서도 높은 가치를 느낄 수 있는 발표였다. 

[청취 후기 ② - LLM-Based MaSE: A Software Development Framework for Developing Multi-agent Systems]
해당 발표는 거대 언어 모델(LLM)을 활용한 소프트웨어 공학 자동화의 가능성을 잘 보여주는 발표였다. 특히, MaSE 방법론과 JADE 플랫폼을 기반으로 멀티 에이전트 시스템(MAS)을 개발하는 전 과정을 LLM으로 자동화했다는 점이 인상 깊었다. 단순히 코드 생성에 그치지 않고, 요구사항 분석부터 설계, 코드 구현까지 전 과정을 프롬프트 기반으로 안내하며, 결과물 간 추적 가능성과 일관성을 유지한 점이 눈에 띄었다. GPT-4를 활용해 학생들의 과제와 비교한 실험에서도 LLM이 더 모듈화되고 정합성 있는 산출물을 생성한 결과도 흥미로웠습니다. 물론 일부 구현 디테일이 부족한 부분도 있었지만, 사람이 며칠 걸릴 작업을 몇 분 만에 수행할 수 있다는 점에서 LLM의 가능성을 실감할 수 있었다. 향후 인간 피드백 활용 등의 방향도 기대되었다.