- 2025년 11월 10일 오후 3:38
- 조회수: 41
정재우
[학회 후기]
지난 11월 6일, 2025년 대한산업공학회 추계학술대회에 참가하였다. 한국과학기술원(KAIST)에서 개최되었으며, 산업공학계에서 활발히 연구를 진행하고 있는 여러 대학교 및 연구실이 참석하였다. 석사 입학 후, 처음 참가해보는 국내 학회였기에 알 수 없는 기대감과 설레임이 느껴졌으며, 발표 세션에서 연구 내용을 소개하기 위해 열심히 준비했다. 인공지능을 활용하여 여러 산업에 적용하고 문제를 해결하는 여러 연구를 접함으로써, 추후 기회가 된다면 나의 연구도 현실 세계나 산업에 도움이 될 수 있으면 좋겠다는 생각으로 여러 발표와 질의 응답을 경청하였다. 11월 7일 발표 세션에서 약 15분 동안 현재 진행하고 있는 연구와 제안 방법론을 연구자들 앞에서 소개했다. 학교 밖에서 진행한 발표는 처음이라 긴장이 많이 되었지만, 나의 연구를 다른 사람에게 알릴 수 있어 정말 소중한 경험이었다.
[발표 후기]
주제 : 인간 피드백 노이즈를 해결하기 위한 강건한 선호 기반 강화 학습
2025년 11월 7일, 대한산업공학회 2일차 오후 3시 세션에 "인간 피드백 노이즈를 해결하기 위한 강건한 선호 기반 강화 학습"이란 주제로 연구 발표를 수행했다. 발표를 진행한 강의실은 만석이었으며, 모든 연구자들이 경청하는 분위기였다. 먼저 연구 분야에 해당하는 강화학습에 대한 짧은 소개를 마치고, 강화학습의 난제인 보상 함수 설계 문제점을 제시하였다. 이를 해결하기 위해 선호도 기반 강화학습(Preference-based Reinforcement Learning)이 등장한 사실을 소개했으며, PbRL의 label data 부족 문제, noise preference label 문제 등을 제시하고 관련 방법론들과 제안 방법론을 제시하였다. 아직 좋은 성능을 보이지 못하는 제안 방법론이지만, 체계적인 추후 계획을 발표하고 2개의 질의에 응답하며 발표를 마무리했다.
질의 응답의 내용은 다음과 같다.
Q1 : 연속적인 행동을 취할 수 있는 실험 환경에서, 로봇이 걷거나 문을 여는 상황이 많이 존재할텐데, 모두 높은 보상을 받지 않나요? 그렇다면 최선의 경험 2개를 선호 비교할 때, 두 경험 모두 정답인가요 아니면 더 나은 한 개만 선호하는건가요?
A1 : 같은 걷기, 문열기 등 로봇이 목표를 수행하는 모습을 보였다 하더라도, 평가자가 선호하는 경험들이 존재할 것 입니다. 한발로 걷기 vs 두발로 걷기 처럼 말이죠. 따라서 비교할 경험 모두 의도한 행동을 로봇이 취한다고 하더라도, 평가자는 주관적으로 선호를 평가할 수 있습니다.
Q1 : 최대 보상 획득이 강화학습의 목적이라고 하셨는데, 그러면 noise가 있는 상황에서도 보상만 최대화할 수 있다면 상관없지 않나요?
A1 : 아닙니다. PbRL은 사용자의 선호도 자체로 보상을 모델링하기 때문에, 만약 잘못된 선호 정보를 제공 받는다면, 보상 함수는 평가자의 의도를 제대로 반영할 수 없을 것이고, 학습에 부정적인 영향을 미칩니다.
[청취 후기]
특히 인상 깊었던 발표는 '푸드 서비스 메뉴 플래닝'과 '대학 행정 지식 관리'에 대한 발표였다. 두 연구 모두 강화학습(RL)이나 검색증강생성(RAG)을 활용해, 과거에는 전적으로 사람의 경험에 의존했던 복잡한 업무(식단 조합, 규정 해석)를 자동화하려는 시도였으며, RAG 챗봇으로 교직원의 단순 응대 시간이 45%나 줄었다는 결과는 매우 획기적인 성과였던 것으로 기억한다. 흥미로운 점은 AI가 모든 것을 대체하는 것이 아니라, AI가 최적의 '기본 안'을 만들면 전문가(영양사)가 최종 검토하고 감성적인 부분을 보완하는 '인간-AI 협업' 모델을 제시한 기여점이다.
한편, '항만 대기질 예측'이나 '이미지 기반 생존분석' 발표에서는 AI가 더 정교한 예측의 영역으로 나아가는 방향성을 확인했다. 선박 1척이 디젤차 5천 대의 오염물질을 내뿜는 심각한 항만 문제 해결을 위해, 선박(동적)과 관측소(정적) 데이터를 구분해 예측하는 GNN 모델은 매우 강건하고 참신했다. 또한 데이터가 부족한 의료 영상에서 '검열된 데이터'까지 고려해 생존율을 예측하는 새로운 믹스업 방식은 기술적 깊이가 느껴졌다.
이번 학회를 통해 AI가 현업의 반복 작업을 줄여주는 것을 넘어, 더 정확한 예측과 복잡한 의사결정을 돕는 강력한 조력자로 자리매김하고 있음을 느꼈고, 앞으로 AI와 산업 전문가의 시너지가 어떻게 더 발전할지 기대된다.