[학회후기]
2026년 6월 4일~5일 경주에서 열린 대한산업공학회 춘계학술대회에 참여하였다. 처음 참여하는 학회이기에 떨리는 마음과 다른 지역에 가서 발표한다는 것에 신기한 마음도 가지고 방문하였다. 다양한 학교 및 기업에서 이번 학회에 참여하여 다양한 분야의 내용을 접할 수 있었으며 학술 내용의 교류의 장이된다는 것이 무엇인지 알아볼 수 있는 기회가 되었다. 또한 타학교의 이전 학우들과 만나 의견을 교류하며 안부를 물어보며 어떤 공부를 하는지에 대해서 알아볼 수 있는 시간이 되었으며 연구실 사람들과 함께 학회를 참가하면서 선배들의 숙련된 모습과 동기들의 발표하는 모습을 통해서 앞으로 내가 어떻게 더 발전해야겠는지 알아볼 수 있는 시간이 되었다. 첫 학회다 보니 아직 어떤 발표를 듣는 것이 좋은지 어떤 질문을 하는 것이 좋은지에 대해서 미숙한 모습이 많이 보였던 것 같다. 다음 학회에 참가하게 된다면 이 부분을 보완해서 학회에 참여할 수 있도록 해야겠다.

[발표 후기]
이번 발표에서는 '다중 목표 및 종속적 희소 보상 과업으로의 탐험 경계 기반 탐색 확장'라는 주제로 연구를 수고하였다. 본 연구는 강화학습에서 목표를 제공하여 도달할 수 있도록 하는 목표 지향 강화학습(Goal-Conditioned Reinforcement Learning, GCRL)에서 복잡한 환경에서 목표에 도달하는 방법이 기존의 방법론에서는 거리가 멀어지거나 장애물이 있으면 도달하기 어려울 것으로 판단하였다. 그래서 목표에 도달할 수 있도록 도움을 줄 수 있게 subgoal을 제공해줌으로써 이를 이용해서 목표에 도달하게 하였다. 기존 방법론이 복잡한 환경에서 목표에 도달하지 못하였지만 제안 방법론은 목표에 잘 도달하면서 성능 향상을 볼 수 있었다.

질문1 : 모델링 할 때 시간이 오래 걸리는 이유가 무엇인지?
답변1 : 현재 실험 환경은 Antmaze 환경에서 실험을 돌렸다. 여기에서 단순히 목표를 찾는 것만이 아닌 Ant라는 객체의 움직임도 잘 움직일 수 있도록 학습을 진행해야하기 때문에 목표에 도달하는 것과 Ant가 움직이는 것 두가지 과정을 학습해야 하기 때문에 모델링에 오래 걸린다.

질문2 : 성공률이 증가하다가 감소하는 이유가 무엇인가요?
답변2 : 앞 질문과 같이 실험 환경이 Antmaze이고 목표에 도달하기위해 움직이는 객체는 Ant이다. 이 때 목표에 도달하는 과정에서 Ant가 넘어지면 다시 일어나지 않고 더이상 목표를 찾는 것을 멈추기 때문에 중간중간마다 Ant가 넘어지는 경우가 많이 발견되었다. 이런 부분은 목표에 빨리 도달하려다가 Ant가 넘어진 것으로 추정된다. 목표를 찾더라도 도달하는 과정을 익숙하고 잘 도달할 수 있는 방안이 필요하다고 생각된다.

[청취 후기]
1. Zero-Shot Anomaly Segmentation with Class-Specific Text Prompts (이우준/서울대학교)
평소 내 연구 분야와는 다소 거리가 있는 주제였지만, 발표자가 기존 연구의 한계와 본 연구의 차별점을 명확하게 짚어주며 흐름을 이해하기 쉽게 구성해 주어 끝까지 집중해서 들을 수 있었다. 특히 클래스 고유 정보를 반영한 텍스트 프롬프트를 생성하고, 이를 CLIP 기반 프레임워크에 효과적으로 녹여내는 방식이 인상적이었다. MLLM을 활용해 클래스 특화 프롬프트를 학습하고, 어댑터 구조로 일반화 능력을 유지하면서도 도메인 적응력을 높이는 설계는 아이디어 자체가 참신하게 느껴졌다. 내 연구와 직접적인 연관은 없었지만, 텍스트와 비전 모달리티를 결합해 새로운 문제를 풀어가는 접근법은 앞으로 내가 참고할 수 있는 방법론적 영감을 주었다. 이런 다양한 분야의 발표를 꾸준히 접하며 시야를 넓혀가야겠다고 느꼈다.

2. VLA 모델을 활용한 하위 과업 구조화 기반 장기 로봇 조작 시스템 (김태규/한국과학기술원)
최근 VLA 관련 연구에 개인적으로 관심을 갖고 있던 터라, 같은 주제를 다른 연구자가 어떤 방식으로 접근하고 구현했는지 구체적으로 확인할 수 있어 특히 흥미로웠다. 발표에서는 장기 조작 과업(long-horizon manipulation task)에서 전체 과업을 단일 지시(instruction)로 수행할 때 오류가 누적되는 문제를 지적하고, 전체 과업을 하위 과업 시퀀스(subtask sequence)로 분리하여 각 단계에 대응하는 언어 지시를 제공하는 구조화된 실행 방식을 제안했는데, π0.5 정책(policy)을 파인튜닝(fine-tuning)하여 실제 하드웨어에서 적용한 점이 인상적이었다. 특히 두 잔의 커피 제조라는 실제 환경에서 10개의 하위 과업(subtask)으로 나누어 실험을 진행하고, 하위 과업 구조화 방식이 종단간(end-to-end) 방식 대비 전체 과업 성공률에서 명확한 차이를 보였다는 실험 결과는 방법론의 유효성을 잘 뒷받침해 주었다. 이 발표를 통해 하위 과업 기반의 구조화 실행이 장기 수평(long-horizon) 조작 문제에 실질적으로 유효한 접근임을 확인했고, 향후 유사한 세팅으로 직접 실험을 진행해 보고 싶다는 생각이 들었다.