고려대학교 DMQA 연구실

2026 대한산업공학회 춘계학술대회 - 김정인

2026년 6월 8일 오후 8:11
조회수: 76

Reviewed by

김정인

[학회후기]

2026년 6월 4일부터 5일까지 경주에서 개최된 대한산업공학회 춘계학술대회에 참여하였다. 이번 학회는 단순히 다양한 연구를 접하는 자리를 넘어, 연구실 안에서 익숙하게 바라보던 나의 연구를 외부의 시선에서 다시 점검해볼 수 있었던 시간이었다. 평소에는 모델의 구조나 성능을 개선하는 데 집중했다면, 학회에서는 연구가 어떤 문제에서 출발했으며 실제로 누구에게 어떠한 가치를 줄 수 있는지를 더 많이 생각하게 되었다. 여러 발표를 들으며 가장 인상 깊었던 점은 연구마다 문제를 풀어가는 방식이 매우 다르다는 것이었다. 동일한 인공지능 기술도 제조, 배터리, 물류, 게임 등 적용되는 분야에 따라 필요한 가정과 평가 기준이 달라졌다. 이를 보며 새로운 모델을 만드는 것만큼, 연구 대상에 대한 이해를 바탕으로 적절한 문제를 설정하는 것이 중요하다는 생각이 들었다. 또한 발표자들이 자신의 연구를 제한된 시간 안에 설명하는 모습을 보면서, 많은 내용을 전달하기보다 연구의 핵심 메시지를 명확히 남기는 것이 좋은 발표의 중요한 요소라는 점도 배울 수 있었다. 이번 학회를 통해 완성된 연구 결과를 확인하기보다, 앞으로 내가 어떤 연구자가 되어야 할지 생각해보게 되었다. 단순히 높은 성능을 제시하는 연구가 아니라, 실제 문제와 연결되고 연구의 필요성을 분명하게 설명할 수 있는 연구를 하고 싶다는 목표가 더욱 명확해졌다. 연구실 구성원들과 함께 발표를 듣고 의견을 나누었던 경험 역시 혼자서는 발견하기 어려운 새로운 관점을 얻는 데 도움이 되었다. 이번 학회에서 얻은 질문과 고민을 앞으로의 연구 과정에 반영하며, 나만의 문제의식이 담긴 연구를 만들어가고 싶다.

[발표 후기]

이번 학회에서는 "역할 정보를 반영한 시간적·협력적 의존성 모델링 기반 다중 에이전트 선호 기반 강화학습"을 주제로 연구 결과를 발표하였다. 강화학습에서는 효과적인 보상 함수를 설계하기 위해 많은 시간과 비용이 요구된다는 한계가 있다. 이를 해결하기 위한 방법으로 선호 기반 강화학습이 제안되었으며, 지금까지는 주로 단일 에이전트 환경을 중심으로 활발한 연구가 이루어져 왔다. 그러나 이를 다중 에이전트 환경으로 확장하기 위해서는 전체 보상에 대한 각 에이전트의 기여도를 구분하는 credit assignment 문제를 함께 고려해야 한다. 기존 다중 에이전트 강화학습 연구에서는 에이전트의 역할 정보를 활용하는 것이 이러한 문제를 완화하는 데 효과적인 것으로 보고되어 왔다. 이에 본 연구에서는 에이전트의 역할 정보를 반영하여 시간적·협력적 의존성을 학습하는 다중 에이전트 선호 기반 강화학습 방법론을 제안하였다. 실험 결과, 역할 정보를 반영한 방법이 기존 방법보다 향상된 성능을 보였으며, 이를 통해 다중 에이전트 선호 학습에서 역할 정보의 활용 가능성과 효과를 확인하였다.

질문1: 동일한 유닛이 있을 때, 역할이 어떻게 작용하나요?

동일한 종류의 유닛이라 하더라도, 상황과 협력 방식에 따라 어떤 에이전트는 적의 공격을 유도하고, 다른 에이전트는 실제 공격을 수행하는 등 서로 다른 역할을 맡을 수 있습니다.

질문2: 제안한 방법론에는 여러 하이퍼파라미터가 사용된 것으로 보이는데, 최적의 값을 찾는 과정에서 어려움은 없었나요? 또한 하이퍼파라미터를 조정하며 느낀 점이 있다면 말씀해 주실 수 있을까요?

제가 제안한 방법론에서 주요하게 고려한 하이퍼파라미터는 K-means 군집화의 군집 수인

k

입니다. 적절한

k

값을 선정하기 위해 여러 설정으로 실험을 진행했지만, 핵심적으로 조정해야 할 하이퍼파라미터가 하나뿐이었기 때문에 탐색 과정이 크게 어렵지는 않았습니다. 물론 연구에 따라 여러 하이퍼파라미터를 동시에 조정해야 하는 경우에는 상당한 어려움이 있을 수 있지만, 본 연구에서는 하이퍼파라미터 조정이 큰 한계로 작용하지는 않았습니다.

[청취 후기]

(1) 불확실성을 고려한 반도체 생산라인 스케줄링 파라미터 동적 제어 (오동윤 / KAIST)

이 발표를 들으며 가장 먼저 떠오른 생각은 인공지능을 산업 현장에 적용할 때 반드시 기존 시스템 전체를 대체해야 하는 것은 아니라는 점이었다. 발표에서는 반도체 생산라인에서 이미 사용되고 있는 규칙 기반 스케줄링 구조를 유지하면서, 엔지니어가 수작업으로 조정하던 파라미터만 강화학습으로 제어하였다. 새로운 알고리즘으로 기존 운영 방식을 완전히 바꾸기보다, 사람이 반복적으로 수행하던 의사결정 영역을 찾아 자동화했다는 점에서 실제 현장 적용을 세심하게 고려한 연구라고 느꼈다. 특히 생산 공정을 공정 단계별 노드와 설비 경쟁 관계를 나타내는 그래프로 표현한 부분이 흥미로웠다. 반도체 생산라인은 공정의 수와 구조가 달라질 수 있기 때문에 특정 크기의 입력만 처리하는 모델은 활용 범위가 제한될 수 있다. 반면 그래프 기반 구조를 활용하면 작은 생산 환경에서 학습한 모델을 더 큰 환경에 적용할 가능성이 생긴다. 이를 통해 모델의 성능뿐만 아니라 환경이 변화했을 때에도 적용 가능한 구조를 설계하는 것이 중요하다는 점을 다시 생각하게 되었다. 무엇보다 이 연구는 강화학습이 작업 자체를 직접 수행하는 데만 사용되는 것이 아니라, 기존 의사결정 시스템의 운영 방식을 실시간으로 조정하는 상위 제어기로도 활용될 수 있음을 보여주었다. 나 역시 강화학습 연구를 진행할 때 새로운 정책의 성능 향상에 집중하는 경우가 많았는데, 이번 발표를 통해 실제 시스템에서 사람이 어떤 부분을 반복적으로 조정하고 있는지 먼저 살펴보는 것이 좋은 연구 문제를 발견하는 출발점이 될 수 있다고 느꼈다.

(2) GuidelineAD: 시각-언어 모델 기반 검사 지침을 활용한 무학습 이상 탐지 (허재혁 / 서울대학교)

이 발표를 들으며 이상 탐지를 단순히 정상과 비정상을 구분하는 문제로만 바라보아서는 안 된다는 생각이 들었다. 실제 검사 현장에서는 모델이 비정상이라고 판단했다는 사실만큼이나, 어떤 검사 기준에서 문제가 발견되었는지를 설명하는 것이 중요하다. GuidelineAD는 정상 이미지에서 표면 상태, 색상 균일성, 구조적 대칭성과 같은 검사 관점을 추출하고, 이를 구체적인 가이드라인으로 변환한 뒤 각 기준의 충족 여부를 평가하였다. 즉, 하나의 이상 점수를 바로 예측하는 대신 사람이 제품을 검사하듯 여러 기준을 차례로 확인하도록 구성한 점이 인상적이었다. 특히 가이드라인을 한 번 생성하고 그대로 사용하는 것이 아니라, 여러 후보를 만든 뒤 별도의 정상 이미지로 품질을 검증하여 대표 가이드라인을 선택한 과정이 흥미로웠다. 생성형 모델이 만든 문장은 자연스럽게 보이더라도 실제 검사 기준으로 항상 유용한 것은 아니기 때문에, 생성과 검증을 분리한 설계가 연구의 신뢰성을 높였다고 생각한다. 또한 여러 가이드라인의 Yes와 No 응답을 단순 투표로 결합하지 않고 토큰 확률을 연속적인 이상 점수로 변환한 점도, 언어모델의 출력을 정량적 판단에 활용하는 방법을 보여주었다. 이 연구를 보며 앞으로의 이상 탐지 모델은 높은 정확도만으로 평가되기보다, 검사 기준을 스스로 구성하고 그 기준에 따라 판단 근거를 제공하는 방향으로 발전할 수 있겠다고 느꼈다. 동시에 모델이 생성한 설명이 실제 이상 원인과 일치하는지 검증하는 문제도 중요하다고 생각했다. 탐지 성능은 우수하지만 설명이 부정확하다면 사용자는 오히려 모델을 신뢰하기 어려울 수 있기 때문이다. 따라서 이상 탐지와 설명 생성을 하나의 기능으로 결합하는 것을 넘어, 설명의 정확성까지 평가하는 연구가 후속 과제로 이어질 수 있겠다는 생각이 들었다.

Conference