- 2026년 6월 8일 오후 7:17
- 조회수: 59
안채원
[학회 후기]
2026 대한산업공학회 춘계학술대회가 6월 4일부터 5일까지 경주에서 열렸다. 학회에 처음 참석하는 것이라 어떤 분위기일지 궁금하기도 하고 설레기도 했다. 막상 와보니 생각보다 훨씬 다양한 분야의 연구들이 발표되고 있었고, 특히 LLM, VLM 등을 활용한 연구들이 학계뿐만 아니라 현직자들 사이에서도 활발하게 다루어지고 있다는 점이 인상적이었다. 현직자들의 발표를 들으면서는 내가 연구실에서 다루는 문제들이 실제 산업에서 어떤 형태로 쓰일 수 있을지 처음으로 구체적으로 그려볼 수 있었다. 아직은 연구의 큰 그림보다 눈앞의 실험에 집중하고 있는 단계라, 이렇게 넓은 시각으로 문제를 바라보는 분들의 발표가 자극이 되었다. 이번 학회를 통해 내가 하고 있는 연구가 어떤 흐름 위에 있는지를 조금이나마 느낄 수 있었고, 앞으로 어떤 질문을 가져가야 할지 고민해보는 계기가 되었다.
[발표 후기]
이번 발표에서는 "유사 객체가 많은 환경에서 비디오 객체 분할을 위한 SAM3 메모리 개선"이라는 주제로 연구를 소개하였다. 본 연구는 SAM3 tracker가 유사한 외형의 방해꾼(distractor)이나 occlusion 상황에서 drift가 발생하는 문제에 주목하였다. 기존 SAM3는 VOS task에서 tracker만을 활용하기 때문에 이러한 상황에서 한번 drift가 발생하면 이를 복구하기 어렵다는 한계가 있었다. 이에 본 연구에서는 tracker의 방해꾼 의심 신호를 트리거로 detector를 호출하는 이중 검증 전략과, occlusion 직후 일정 frame의 메모리 저장을 유예하는 전략을 제안하였다. 발표를 준비하고 진행하면서, 각 전략이 왜 필요한지를 청중에게 더 직관적으로 전달하는 것이 중요하다는 점을 느꼈다. 이를 통해 앞으로 연구의 동기와 흐름을 더 설득력 있게 정리해야겠다는 생각을 하게 되었다.
질문 1: occlusion 직후 skip하는 frame 수가 5인데, 너무 짧은 것 아닌가? 답변 1: 실험에 사용한 데이터셋은 5fps 단위로 샘플링된 것이기 때문에, skip 5는 원본 영상 기준으로 약 25frame에 해당하는 구간입니다. 표면적인 숫자는 작아 보이지만 실제 시간 축 상에서는 충분한 유예 구간이 확보됩니다.
질문 2: 방해꾼과 occlusion이 동시에 발생하는 등 더 복잡한 상황에서는 어떻게 대처할 것인가? 답변 2: 현재 방법은 SAM3가 추적 초기와 occlusion이 발생하지 않는 구간에서 안정적으로 동작한다는 가정에 기반하고 있어, 복합적인 시나리오에서는 한계가 있을 수 있습니다. 향후 target과 방해꾼의 위치 및 장면 맥락 정보를 MLLM에 전달하여 더 유연하게 대처하는 방향을 계획하고 있습니다.
[청취 후기]
1. Cliff Tokens: Where and Why Mathematical Reasoning Falls Off (고재영 / 서울대학교, poster)
해당 연구는 LLM의 수학적 추론 과정에서 성능이 급격히 저하되는 지점인 cliff token을 정의하고, 이를 탐지 및 분류하는 방법론을 제안한 연구였다. 단순히 정답률을 높이는 방향이 아니라, 추론 실패가 어디서 어떻게 발생하는지를 token 수준에서 파고든다는 접근이 흥미로웠다. token-wise potential이 이전 시점 대비 크게 낮아지는 지점을 z-test 기반 adaptive threshold로 감지하고, deterministic, uncertain, sampled-off의 세 유형으로 분류하는 cliff taxonomy를 제안하였다. 같은 모델 계열 내에서도 스케일에 따라 taxonomy 분포가 달라진다는 분석은, 단순한 스케일업이 추론 안정성을 보장하지 않는다는 점을 시사하고 있어 인상적이었다. 나아가 cliff token 위치에 직접 DPO 감독 신호를 부여하는 Cliff-DPO를 통해 실제 벤치마크 성능 향상까지 보여준 점에서, 분석에서 그치지 않고 실용적인 방향으로 연결한 흐름이 자연스럽게 느껴졌다. 모델이 틀리는 순간을 내부적으로 포착한다는 발상 자체가 인상 깊었고, 내 연구에도 유사한 시각을 적용해야겠다는 생각이 들었다.
2. Hardware-Efficient Optimization: GCG-Specialized Triton Kernels for 4-bit LLMs (최준혁, 한성원 / 고려대학교, poster)
해당 연구는 4-bit quantized LLM 환경에서 GCG 공격을 효율적으로 수행하기 위한 Triton 기반 커널 최적화 방법을 제안한 연구였다. GCG는 모델이 유해한 답변을 유도하는 suffix를 자동으로 탐색하는 공격 기법인데, 이를 실제로 수행하려면 막대한 GPU 메모리와 연산량이 필요하다는 현실적인 한계가 있다. 해당 연구에서는 GCG 연산의 특수성을 활용하여 출력 KV 캐시 저장 방식을 개선하고, NF4-STE, GCG-FA 등을 적용함으로써 fp16 대비 VRAM 사용량을 63% 줄이면서도 유사한 공격 성공률을 유지하는 결과를 보여주었다. 학부에서 보안 전공을 다뤘던 터라 LLM 보안과 관련한 연구에 자연스럽게 눈이 갔고, 공격 기법 자체의 효율화라는 관점에서 접근했다는 점이 특히 흥미로웠다. 덕분에 포스터 앞에서 발표자와 더 깊이 이야기를 나눌 있었고, 보안과 LLM이 교차하는 지점에서 앞으로 어떤 연구들이 나올 수 있을지 생각해보는 계기가 되었다.