2026 대한산업공학회 춘계학술대회 - 김성수
- 2026년 6월 8일 오전 10:41
- 조회수: 91
Reviewed by
김성수
김성수
[학회후기]
(1) 신라의 미소를 머금은 경주에서 열린 2026년 대한산업공학회 춘계학술대회에 참가하였다. 지난번에도 방문했던 학회장이라 이번에는 한결 친숙하게 다가왔다. DSBA 연구원, 경희대학교 학부 후배 등 반가운 얼굴을 많이 만날 수 있었고, 스몰토크를 나누며 서로의 근황을 들을 수 있었다.
(2) AI 트렌드의 변화가 얼마나 빠른지를 이번 학회에서 다시 한 번 실감했다. 재작년에 방문했을 때와 비교하면 발표 주제 자체가 완전히 달라졌고, 주어진 문제를 해결하려는 접근법마저 100% 바뀌어 있었다.
(3) 내가 꼽은 이번 학회의 키워드는 (1) AI 에이전트, (2) 거대모델이다. 다양한 도메인에서 AI 에이전트를 어떻게 적용할 수 있을지에 대해 여러 연구자들의 다채로운 접근을 볼 수 있었다. 개인적으로는 벤치마크 데이터에 기반한 일반적인 접근이 아니라, 실제 데이터를 기반으로 한 해결 과정을 볼 수 있다는 점이 대한산업공학회만의 큰 매력이 아닐까 싶다. 다만 또 다른 최근 화두인 피지컬 AI에 대한 발표가 많지 않았던 점은 아쉬웠다.
(4) 포스터 발표의 가치를 새삼 느낄 수 있었다. AI 알고리즘이 빠르게 발전하면서, 완벽하게 짜인 발표가 아니라면 한 번에 모든 것을 이해하기란 이제 어려워진 듯하다. 나만을 위한(?) 발표가 진행되는 가운데 궁금한 점을 중간중간 계속 물어볼 수 있다는 점에서, 포스터 세션의 진가를 이번 학회를 통해 깨달을 수 있었다.
(5) 10여 명의 신입생·인턴들과 함께했고, 캡틴으로서 참가한 첫 학회였다. 보완해야 할 점도 정말 많지만, 모두가 무사히 완주해 준 것에 감사하다. 이 자리를 빌려 학회 일정이 원활하게 진행되도록 주도적으로 이끌어 준 성수(박), 처음임에도 각자의 발표를 멋지게 마무리해 준 신입생들, 그리고 솔선수범해 준 고참 인원들에게 고맙다는 말을 전한다.
[발표 후기]
이번 학회에서는 "의료 이미지 분할을 위한 SAM3 기반 MLLM 에이전트"를 주제로 발표하였다. SAM3는 일반 도메인에서 에이전트를 기반으로 한 텍스트 기반 이미지 분할에서 Foundation 모델급 성능을 보이지만, 복잡한 텍스트에 대해서는 성능이 저조하다. 이를 극복하기 위해 기존 연구들은 SAM3에 에이전트를 "텍스트 핵심 요약" 용도로 결합해 활용해 왔으나, 의료와 같은 특수 도메인의 텍스트에서는 이 전략이 제대로 동작하지 않는다. 이에 본 연구는 에이전트를 텍스트에 적용하는 대신, 이미지 측면에서 "핵심 Mask를 잘 선정하는 전략"으로 접근하여 의료 도메인에서의 해결 가능성을 확인하였다.
질문1: 비교 방법론으로 zero-shot뿐만 아니라 fine-tuned 방법론과도 함께 비교해 보았는가? (연세대학교 윤현수 교수님)
답변1: 아직 비교해 보지 못했으나 향후 진행할 예정이다. 개인적으로는 fine-tuned 방법론을 upper bound로 두고, 그 성능에 근사하는 모델을 만드는 것을 목표로 하고 있다.
질문2: 특정 부위를 찾는 것 외에, 정상/이상을 구분하는 용도로도 적용이 가능한가? (서울대학교 DSBA 김도윤 박사과정)
답변2: 개인적으로 느끼기에 SAM3는 아직 2~3단어 수준의 명사구 정도만 이해할 수 있다. 따라서 "맥락"의 요소가 포함되는 정상/이상 구분은 현재로서는 어렵다고 생각한다. 다만 해당 방향의 연구 역시 상당히 유망할 것으로 본다.
[청취 후기]
(1) GuidelineAD: 시각-언어 모델 기반 검사 지침을 활용한 무학습 이상 탐지 (서울대학교 허재혁)
산업 이상탐지 모델을 학습하려면 특정 도메인의 데이터 수집이 필요하다. 그런데 이 과정은 데이터 수집뿐만 아니라 레이블링에도 큰 비용이 든다. 이를 극복하기 위해 본 연구는 에이전트를 기반으로 학습 없이 이상탐지를 수행하고자 한다. 에이전트를 통해 이상 탐지 항목들을 열거하고 검증 과정을 거침으로써, 제안 방법론은 에이전트 기반 zero-shot 이상탐지의 가능성을 입증하였다.
(2) 다중 에이전트 토론 기반 유망 기술 예측: 논증 패턴을 기반으로 한 불확실성 정량화와 그 활용 (서울대학교 이수인)
에이전트 간 토론을 활용해 특허 기반 유망 기술을 예측하고자 하는 연구이다. 내가 PI로 수행 중인 하이닉스 과제에서도 이러한 에이전트 간 토론을 활용해 산업 이상탐지를 수행하고자 하기에 관심이 갔고, 방법론 측면에서도 하이닉스 과제의 baseline 모델로 쓰고 있는 MAD 프레임워크를 활용한다는 점에서 더욱 눈길이 갔다. 이 연구의 차별점은 LLM에게 confidence 값을 함께 요청해 얻은 결과로, 이를 기반으로 10% 이상의 성능 향상을 거두었다는 점이다. 여러 이야기를 나눈 끝에, "LLM이 내놓는 신뢰도를 과연 믿을 수 있을까?"라는 질문을 던지게 되었고, 그 값보다는 LLM이 "Yes"라고 답하는 토큰의 확률을 활용하는 편이 더 낫지 않을까 하는 생각을 하게 되었다.