Conference

Conference

Number of entries: 753 (필터 적용됨)
11
2026.06

2026 대한산업공학회 춘계학술대회 - 정진용

[학회 후기]2026년 6월 경주 화백 컨벤션센터에서 진행된 2026 대한산업공학회 춘계학술대회에 참가하였다. 여러 차례 참가해 본 학회지만, 올 때마다 새로운 자극을 받게 되는 것 같다. 이번에도 연구실 동료들과 함께 참가하여 즐거운 시간을 보냈고, 서로의 발표를 응원하며 좋은 에너지를 얻을 수 있었다. 학회 기간 동안 다양한 도메인의 문제를 서로 다른 관점에서 정의하고 풀어내는 연구들을 접할 수 있었다. 비슷한 방법론을 사용하더라도 어떤 문제를 풀고자 하는지에 따라 문제를 정의하는 단계에서부터 접근 방식이 달라진다는 점이 흥미로웠다. 평소에도 방법론 자체보다 문제를 바라보는 관점이 더 중요하다고 생각해 왔는데, 이번 학회를 통해 그 생각을 다시금 되새기게 되었다. 이렇게 다양한 관점을 접하다 보니 자연스럽게 내 연구도 다른 각도에서 되돌아보게 되었고, 그동안 진행해 온 연구와 생각들을 점검해 볼 수 있었던 의미 있는 시간이었다.[발표 후기]이번 학회에서는 "도메인별 예측 헤드의 평균화를 통한 도메인 일반화"라는 주제로 발표를 진행하였다. 본 연구는 개별 도메인들이 하나의 meta distribution으로부터 샘플링된 것이며, 테스트 도메인 역시 이 분포에 포함된다는 관점에서 출발한다. 따라서 meta distribution을 잘 추정하는 것이 곧 도메인 일반화로 이어진다고 보았으며, 이를 위해 다중 헤드 구조를 기반으로 접근하였다. 각 헤드를 해당 도메인 전문가로 학습시키는 expert loss와 함께, 헤드들의 파라미터 평균으로 정의되는 centroid 헤드를 전체 도메인 데이터에 대해 직접 학습시키는 centroid loss를 도입하여 도메인 일반화를 달성하고자 하였다.질문 1. Camelyon17 데이터셋에서는 accuracy를 사용하였는데, iWildCam 데이터셋에서는 왜 F1 score를 사용한 것인가요?답변 1. 해당 데이터셋은 도메인별로 데이터 수가 불균형하고, 전체 클래스 기준으로 보아도 데이터 수가 불균형합니다. 이런 상황에서 accuracy를 사용하게 되면 모델 성능을 제대로 측정할 수 없기 때문에, 불균형 상황을 반영하여 모델 성능을 측정할 수 있는 F1 score를 사용한 것입니다.질문 2. 평균 파라미터 헤드를 사용하여 산출하는 centroid loss를 통해서 meta distribution 중심으로 모델이 학습하는 representation이 확장된다고 생각하는데, 이와 관련된 실험을 한 것이 있나요?답변 2. iWildCam 기준으로 도메인별 representation의 second moment dispersion을 학습 과정 동안 측정한 실험이 있습니다. 제안 방법이 ERM 대비 dispersion을 낮추는 것, 즉 도메인 간 feature second moment가 보다 동질적으로 정렬되는 것을 실험적으로 확인했습니다. [청취 후기]1. RAG 환경에서의 답변 불가능 질의 사전 탐지 프레임워크 (김수연 / 서울대학교, Poster)일반적인 RAG 프레임워크는 답변을 생성하기 어려운 질의에 대해서도 억지로 답변을 만들어내서 사용자에게 혼동을 주는 경우가 많은데, 이 연구는 답변 불가능한 질의를 사전에 탐지하는 문제를 대조 학습으로 풀고자 하였다. 대조학습에서 positive, negative를 어떻게 정의하였는지 질문하였는데, 답변 가능한 질의로부터 생성된 답변을 positive, 그렇지 않은 것은 negative로 정의하였다는 설명을 들었다. 비교적 단순한 아이디어임에도 좋은 결과를 보여주었다는 점이 인상 깊었다. Hallucination이 RAG의 큰 실용적 문제라는 점을 생각해보면, 복잡한 방법론보다 문제 상황 자체를 잘 정의하고 접근한 것이 좋은 성과로 이어진 사례라고 느꼈다.2. 불확실성을 고려한 반도체 생산라인 스케줄링 파라미터 동적 제어 (오동윤 / KAIST)발표에서 인상 깊었던 점은 인공지능을 산업 현장에 적용할 때 기존 시스템 전체를 대체할 필요가 없다는 관점이었다. 반도체 생산라인에서 이미 운영 중인 규칙 기반 스케줄링 구조는 그대로 유지하면서, 엔지니어가 수작업으로 조정하던 파라미터만을 강화학습으로 제어하였는데, 사람이 반복적으로 수행하던 의사결정 영역을 찾아 그 부분만 자동화했다는 점에서 현장 적용을 세심하게 고려한 연구라고 느꼈다. 또한 생산 공정을 공정 단계 노드와 설비 간 경쟁 관계로 이루어진 그래프로 표현하여, 작은 환경에서 학습한 모델을 구조가 다른 더 큰 환경으로 확장할 수 있도록 한 점도 흥미로웠다. 학습 환경과 다른 환경에서도 동작하는 모델을 목표로 한다는 점에서 내가 연구하는 도메인 일반화와도 어느 정도 맞닿아 있다고 느꼈고, 성능만큼이나 환경 변화에 견디는 구조를 설계하는 것이 중요하다는 점을 다시 생각하게 되었다.
Reviewed by 정진용 정진용
2026.06.11
Read More
11
2026.06

2026 대한산업공학회 춘계학술대회 - 황순혁

[학회 후기]2026년 6월 경주에서 열린 대한산업공학회 춘계학술대회에 참가하였다. 이번 학회에서는 평소 연구실에서 접하는 분야뿐만 아니라 다양한 연구 주제와 방법론을 접할 수 있어 의미 있는 시간이었다. 특히 연구 분야마다 문제를 정의하고 접근하는 방식이 다르다는 점이 인상적이었으며, 이를 통해 새로운 관점을 얻을 수 있었다. 또한 예전과 비교해 발표를 바라보는 시각이 달라졌음을 느꼈다. 단순히 내용을 이해하는 것을 넘어 연구의 강점과 한계, 확장 가능성 등을 함께 생각하며 들을 수 있었고, 그만큼 연구 경험이 쌓였음을 실감할 수 있었다. 학회 기간 동안 다양한 연구를 접하며 현재 진행 중인 연구를 다시 돌아볼 수 있었고, 연구실 동기들과 함께 학회에 참여하며 좋은 자극과 재충전의 시간을 보낼 수 있었다.[발표 후기]이번 대한산업공학회 춘계공동학술대회에서는 "신뢰도 기반 샘플 선택을 활용한 비전 언어 모델의 테스트 시점 방법론"이라는 주제로 발표를 진행하였다. 요즘 재밌게 진행하고 있는 연구라서 그런지, 발표하는 것도 긴장되지 않고 재밌었다. 발표 이후에는 관련 연구를 수행하는 연구자들과 의견을 나누며 연구의 방향성과 개선점에 대해 생각해 볼 수 있었다. 또한 다른 분야의 발표들을 들으며 현재 연구에 적용해 볼 수 있는 아이디어들도 얻을 수 있어 의미 있는 시간이었다. 이번 학회를 통해 연구를 공유하고 다양한 관점을 접하는 것의 중요성을 다시 한번 느낄 수 있었다. 질문 1. Cifar10/100/ImageNet-C 데이터셋에 대해서만 실험을 진행했는데, DomainNet 데이터셋은 사용하지 않을 예정인가?답변 1. 간단한 corruption에 대한 일반화 성능을 보기 위해 Cifar류와 ImageNet 데이터셋에 대해서 우선적으로 실험을 한 것이다. 좀 더 직관적인 distribution shift을 담고 있는 officehome, domainnet 데이터셋에도 추가 실험 진행 예정이다.질문 2. Reliability Test 내 Density Test에서 k-nn의 k와 density 하이퍼파라미터는 얼마인가?답변 2. k는 30, density는 0.6으로 설정했다. 두 가지 모두 실험적으로 최고의 성능인 경우에 해당한다.질문 3. 샘플에 대한 Reliability를 고려할 때 점점 기준을 완화시킨다고 했는데, linear하게 감소시키는가, 아니면 decay를 활용하는가?답변 3. decay로 보는게 맞다. exponential하게 그 기준을 급격하게 완화시킨다. 학습 초반에는 학습 속도가 빠르기 때문에 많은 timestep을 부여하지 않기 위함이다.[청취 후기]1. 대규모 언어모델 파인튜닝을 활용한 생존분석 모델 설계 연구 (고려대학교 정주이)해당 발표는 LLM을 활용하여 공정 조건의 의미론적 표현을 학습하고 공구 마모에 활용하는 연구였다. 기존 공구 마모 예측 연구는 주로 센서 데이터나 공정 변수 자체를 입력으로 사용하는 경우가 많았다. 반면 해당 연구에서는 다양한 공정 조건을 LLM을 통해 자연어 형태의 공정 분석 서술어로 변환한 뒤, 이를 의미 공간에서 학습하여 공정 조건 간 관계를 표현하는 방법을 제안하였다. 도메인 지식을 언어 형태로 변환하여 활용한다는 아이디어가 좋다고 생각하였으며 센서 신호나 마모 레이블 없이 공정 조건만으로 의미적 관계를 학습한다는 점이 인상깊었다. 해당 발표를 들으며, 대규모 언어모델을 단순한 생성 모델이 아닌 데이터 표현 학습 문제에 결합으로 활용 가능하다고 생각하였다.2. AlienLM: Vocab 변환을 통한 API 환경에서의 대형언어모델 데이터 비식별화 방법론 (서울대학교 김재희)해당 발표는 API 기반 LLM을 활용하는 과정에서 발생할 수 있는 데이터 유출 문제를 해결하기 위해, 민감한 정보를 보호하면서도 언어모델의 활용성을 유지할 수 있는 데이터 난독화 기법을 제안한 연구였다. 최근 많은 기업과 연구기관에서 외부 LLM 서비스를 활용하고 있는 만큼, 실제 환경에서 발생할 수 있는 보안 문제를 다루고 있다는 점에서 흥미롭게 들을 수 있었다. 특히 사람이 읽기 어려운 형태로 데이터를 변환하면서도 언어모델은 해당 정보를 활용할 수 있도록 설계한 접근이 인상적이었다. 무엇보다 기억에 남았던 점은 연구 내용뿐만 아니라 발표의 전달 방식이었다. 발표자는 연구의 필요성과 문제 상황을 먼저 설명한 뒤 해결 방안을 소개하는 흐름으로 발표를 진행하였는데, 덕분에 관련 배경지식이 많지 않은 청중도 내용을 쉽게 이해할 수 있었다. 연구를 진행하는 입장에서는 방법론의 세부 내용에 집중하는 경우가 많은데, 이번 발표를 들으며 연구의 기술적 우수성뿐만 아니라 문제의 중요성과 해결 과정의 논리성을 효과적으로 전달하는 것 또한 중요하다는 점을 다시 한번 느낄 수 있었다.3. GuidelineAD: 시각-언어 모델 기반 검사 지침을 활용한 무학습 이상 탐지 (서울대학교 허재혁)해당 연구는 VLM(Vision-Language Model)을 활용하여 정상 상태의 기준을 자동으로 생성하고, 이를 바탕으로 이미지 내 이상 여부를 탐지하는 방법을 제안한 연구였다. 기존 외관 검사 분야에서는 이상 데이터를 충분히 확보하기 어렵고, 새로운 제품이나 환경이 등장할 때마다 모델을 다시 학습해야 하는 문제가 존재한다. 이에 본 연구에서는 정상 데이터만을 활용해 검사 기준을 구축하고, VLM이 생성한 설명을 통해 이상 여부를 판단하는 접근을 제안하였다. 또한 단순히 이상을 탐지하는 데 그치지 않고, 왜 이상으로 판단했는지에 대한 근거까지 함께 제공한다는 점이 특징적이었다. 개인적으로는 VLM을 활용해 정상 상태를 정의하고 이를 기준으로 이상을 판단한다는 연구 주제가 매우 흥미롭게 느껴졌다. 나 역시 관련 프로젝트를 수행하면서 정상 상태에 대한 기준을 어떻게 설정할 것인지 고민한 경험이 있어, 특히 이상 점수를 산출하는 과정에 관심을 가지고 발표를 들었다. 발표에서는 이러한 핵심 아이디어와 방법론을 이해하기 쉽게 설명해 주었고, 연구의 흐름 또한 자연스럽게 전달되어 내용을 따라가기 수월했다. 이를 통해 연구 내용 자체뿐만 아니라 청중이 이해하기 쉬운 방식으로 연구를 설명하는 발표 역량의 중요성도 다시 한번 느낄 수 있었다.
Reviewed by 황순혁 황순혁
2026.06.11
Read More
09
2026.06

2026 대한산업공학회 춘계학술대회 - 장성호

[학회 후기]2026년 6월 4~5일 경주에서 개최된 대한산업공학회 춘계학술대회에 참가하였다. 학회에 참가하며 평소 연구실에서 접하던 연구뿐만 아니라 다양한 분야의 연구들을 접할 수 있는 기회가 되었다. 평소에는 현재 수행하고 있는 연구와 직접적으로 관련된 논문이나 주제를 중심으로 살펴보는 경우가 많다. 그러다 보니 자연스럽게 익숙한 분야 안에서만 사고하게 되는 경우가 있는데, 이번 학회에서는 다양한 연구자들의 접근 방법과 문제 정의 방식을 접하면서 새로운 관점을 얻을 수 있었다. 특히 같은 방식이라도 연구 분야에 따라 문제를 바라보는 시각과 연구를 전개하는 방식이 상당히 다르다는 점이 인상 깊었다. 또한 학회를 다니다 보니 예전과는 다르게 발표 내용을 이해하는 폭이 넓어졌다는 점도 느낄 수 있었다. 처음 학회에 참석했을 때는 발표 주제 자체를 따라가는 것에 집중했다면, 이번에는 연구의 한계점이나 향후 확장 가능성, 실험 설계의 타당성 등 이전보다 다양한 측면에서 발표를 바라볼 수 있었다. 여러 연구를 진행하며 경험이 쌓인 만큼 연구를 보는 시야도 조금씩 넓어지고 있다는 것을 체감할 수 있었다.이번 학회에서는 대부분의 세션에서 적어도 하나 이상의 흥미로운 발표를 찾을 수 있었으며, 다양한 연구 주제와 방법론을 접하면서 현재 진행 중인 연구를 다른 관점에서 다시 생각해 볼 수 있었다. 또한 연구실 동기들과 함께 학회에 참석하며 연구에 대한 이야기를 나누고 새로운 환경에서 시간을 보낼 수 있어 좋은 리프레시의 기회가 되었다.[발표 후기]이번 대한산업공학회 춘계공동학술대회에서는 "편미분방정식(PDE) 대리모델의 도메인 일반화 성능 향상을 위한 전문가 혼합 기법"에 대해 발표를 진행하였다. 본 연구는 PDE surrogate model이 학습되지 않은 물리 파라미터 환경(OOD)에서도 강건하게 예측할 수 있도록 전문가 간 예측 불일치(disagreement)를 활용하는 relation-adaptive fusion 방법을 제안하였다.질문 1. Invariant 특징은 어떻게 학습할 수 있는가? 또한 제안 방법이 PDE를 위배하지 않는다는 보장이 있는가?답변 1. 본 연구는 물리 법칙 자체를 강제하는 Physics-Informed Learning 방식이 아니라, 여러 파라미터 환경에서 공통적으로 유지되는 표현을 학습하여 일반화를 유도하는 접근이다. 따라서 PDE를 반드시 만족한다는 이론적 보장을 제공하지는 않는다. 다만 서로 다른 환경에서 일관되게 유지되는 특징을 활용하여 unseen parameter 환경에서도 강건한 예측을 수행하는 것을 목표로 한다. 향후에는 물리 제약 조건을 함께 고려하는 방향으로 확장 가능할 것으로 생각된다.질문 2. Mixture-of-Experts 구조에서 편미분 정보는 구체적으로 어디에 활용되는가?답변 2. 본 연구에서 각 expert는 동일한 neural operator 구조를 사용하지만 입력으로 사용하는 정보가 서로 다르다. 하나의 expert는 상태(state) 정보만을 사용하고, 다른 expert는 gradient 정보, 또 다른 expert는 diffusion 및 curvature와 관련된 2차 미분 정보를 사용한다. 이를 통해 각 expert가 PDE의 서로 다른 물리적 관점을 학습하도록 설계하였다.질문 3. 시뮬레이션 데이터가 충분하지 않은 경우에도 활용 가능한가?답변 3. 현재 연구는 생성된 PDE 시뮬레이션 데이터를 활용하여 surrogate model을 학습하는 환경을 가정하고 있다. 따라서 데이터가 매우 부족한 경우에는 직접 적용에 한계가 존재할 수 있다. 다만 Physics-Informed Learning, Active Learning, 실험 설계(DoE) 기법 등과 결합한다면 적은 데이터 환경에서도 활용 가능성이 있을 것으로 생각한다.[청취 후기](1) 공정조건의 의미론적 표현 학습을 기반으로 한 강건한 공구 마모예측 모델 개발 - 울산과학기술원 박소연해당 발표는 LLM을 활용하여 공정 조건의 의미론적 표현을 학습하고 공구 마모에 활용하는 연구였다. 기존 공구 마모 예측 연구는 주로 센서 데이터나 공정 변수 자체를 입력으로 사용하는 경우가 많았다. 반면 해당 연구에서는 다양한 공정 조건을 LLM을 통해 자연어 형태의 공정 분석 서술어로 변환한 뒤, 이를 의미 공간에서 학습하여 공정 조건 간 관계를 표현하는 방법을 제안하였다. 도메인 지식을 언어 형태로 변환하여 활용한다는 아이디어가 좋다고 생각하였으며 센서 신호나 마모 레이블 없이 공정 조건만으로 의미적 관계를 학습한다는 점이 인상깊었다. 해당 발표를 들으며, 대규모 언어모델을 단순한 생성 모델이 아닌 데이터 표현 학습 문제에 결합으로 활용 가능하다고 생각하였다.(2) 복잡계 주요안전품목 식별 인공지능 Agent 개발 - 부산대학교 금재혁해당 발표는 FMEA를 기반으로 LLM을 활용하여 잠수함의 CSI를 식별하는 프레임워크를 제안하였다. 기존 FMEA는 전문가가 장비의 고장 형태와 발생도, 심각도 등을 분석하여 위험도를 평가하는 방식으로 수행된다. 그러나 많은 문서와 보고서를 검토해야 하기 때문에 시간과 인력이 많이 필요하다. 해당 연구는 이러한 문제를 해결하기 위해 LLM을 활용하여 잠재적 고장 형태, 발생도, 심각도 등을 자동으로 도출하고 위험도를 계산하여 CSI 후보를 식별하는 프레임워크를 제안하였다.인상 깊었던 부분은 단순히 문서 요약에 LLM을 적용하는 것이 아니라 FMEA의 기존 절차를 그대로 유지하면서 각 단계에 LLM을 적용했다는 점이다. 또한 문서 근거, 출처를 함께 제시하여 설명 가능성을 확보하려고 한 점도 흥미로웠다. FMEA와 같은 산업공학의 전통적인 방법론을 유지하면서 LLM을 보조 도구로 활용하는 점이 인상깊었다.(3) 대규모 언어모델 파인튜닝을 활용한 생존분석 모델 설계 연구 - 고려대학교 정주이해당 발표는 LLM을 활용하여 생존분석을 수행하는 Survival-LLM에 대한 연구를 제안하였다. 기존 생존분석은 Cox Proportional Hazard Model(CPH), Random Survival Forest(RSF), DeepSurv와 같은 통계·기계학습 기반 방법이 주로 활용되어 왔으며, 정형화된 임상 변수들을 이용하여 환자의 생존 위험도를 예측하는 데 초점을 두고 있다. 반면 본 연구는 최근 발전한 LLM이 제한된 데이터만으로도 환자의 생존 위험도를 추론할 수 있는지, 그리고 단순 예측을 넘어 임상적 해석까지 제공할 수 있는지를 검증하고자 하였다. 발표에서 가장 인상 깊었던 부분은 제한된 환자 데이터만을 이용해 다수의 환자쌍(pairwise samples)을 생성하고, 이를 기반으로 LLM이 상대적 생존 위험도를 학습하도록 설계한 점이었다. 일반적인 생존분석이 개별 환자의 위험 함수를 직접 추정하는 것과 달리, 환자 간 위험도 순위를 비교하는 방식으로 문제를 재정의하여 적은 데이터에서도 학습이 가능하도록 한 접근이 흥미롭게 느껴졌다.반면 아쉬웠던 점도 있었다. 발표에서는 모델 성능 평가를 위해 주로 C-index만을 활용하였는데, 생존분석에서는 예측 정확도뿐만 아니라 시간에 따른 예측 성능과 확률 예측의 보정 정도를 평가하기 위해 Integrated Brier Score(IBS)나 Time-dependent AUC와 같은 지표도 널리 사용된다. 이에 대해 질의응답 시간에 추가적인 생존분석 지표를 활용하지 않은 이유를 질문하였으나, 해당 부분은 현재 진행 중인 연구로 향후 연구 방향에 포함되어 있다는 답변을 들을 수 있었다. 개인적으로는 다양한 평가 지표를 함께 제시하였다면 제안 방법의 강점과 한계를 더욱 명확하게 확인할 수 있었을 것이라는 아쉬움이 남았다.
Reviewed by 장성호 장성호
2026.06.09
Read More
09
2026.06

2026 대한산업공학회 춘계학술대회 - 손병우

[학회 후기]6월 4일부터 5일까지, 경주에서 열린 2026 대한산업공학회 춘계학술대회에 참석하였다. 이번 학회는 처음으로 학회에 참여해 구두 발표를 진행하는 자리였기 때문에 많이 긴장되었지만, 동시에 연구실을 벗어나 다양한 연구를 직접 보고 들을 수 있다는 점에서 설레는 마음도 컸다. 그동안 연구실에서 여러 차례 발표를 준비하고 교수님의 피드백을 받으며 연구 내용을 정리해온 덕분에, 긴장 속에서도 비교적 차분하게 학회에 참여할 수 있었다.이번 학회에서는 다양한 산업공학 분야에서 인공지능을 활용한 연구들을 접할 수 있었다. 특히 AI Agent, 대규모 언어 모델(Large Language Model, LLM), 비전-언어 모델(Vision-Language Model, VLM) 등을 활용한 연구들이 활발히 다루어지고 있어 최근 연구 흐름을 체감할 수 있었다. 또한 발표와 포스터 세션에 참여하며 다른 연구자들이 문제를 어떻게 정의하고, 실험을 어떻게 설계하며, 결과를 어떻게 설득력 있게 전달하는지 배울 수 있었다. 특히, 실제 산업계에서 근무하시는 분들의 발표를 들으며, 현재 사내에서 어떤 문제들이 중요하게 다루어지고 있는지, 그리고 이를 해결하기 위해 인공지능 기술이 어떤 방식으로 적용되고 있는지를 구체적으로 알 수 있었다. 이를 통해 단순히 논문 속 방법론을 이해하는 것을 넘어, 실제 현장에서 마주하는 데이터 보안, 도메인 지식 부족, 시스템 제약, 인과관계 분석의 어려움 등 현실적인 문제들에 대한 견문을 넓힐 수 있었다.[발표 후기]이번 발표에서는 “비전-언어 모델의 원격 탐사 도메인 일반화를 위한 푸리에 변환 기반 프롬프트 튜닝 방법론”이라는 주제로 연구를 소개하였다. 본 연구는 비전-언어 모델(Vision-Language Model, VLM)이 특정 Source Domain에서 학습될 경우, 학습 도메인에 치우친 표현을 학습하게 되어 보지 못한 Target Domain에서 일반화 성능이 저하될 수 있다는 문제에서 출발하였다. 특히 원격 탐사(Remote Sensing, RS) 이미지는 위성 혹은 항공 센서를 통해 관측된 이미지로, 작은 객체, 센서 간 변동성, 계절 및 대기 변화, 지리적 분포 변화 등 다양한 도메인 변화 요인을 포함한다. 따라서 RS 도메인에서는 단순히 학습 데이터에 잘 맞는 모델보다, 다양한 unseen target domain에서도 강건하게 동작할 수 있는 모델이 중요하다고 보았다. 본 연구에서는 이러한 흐름을 바탕으로, RS 도메인의 핵심 특징인 주파수 정보와 깊은 레이어의 고수준 의미 특징을 함께 활용하는 프롬프트 튜닝 방법론을 제안하였다. 구체적으로, 프롬프트에 푸리에 변환을 결합하여 공간적 특징뿐만 아니라 주파수 기반 특징을 함께 학습하도록 하였고, CLIP의 깊은 레이어에 프롬프트를 주입하여 고수준 의미 특징 중심의 표현 학습을 유도하였다. 실험 결과, 제안 방법론은 대부분의 Target 데이터셋에서 기존 SOTA 방법 대비 향상된 성능을 보였으며, 특히 푸리에 비율과 레이어 깊이에 따른 추가 실험을 통해 깊은 레이어 중심의 프롬프트 튜닝이 성능 향상에 중요한 역할을 한다는 점을 확인할 수 있었다. 발표를 준비하고 진행하면서 내가 제안한 방법론의 구조를 설명하는 것만큼이나, 왜 RS 도메인에서 주파수 정보와 고수준 의미 특징이 중요한지를 설득력 있게 전달하는 것이 중요하다는 점을 다시 느꼈다. 또한 발표 이후 질의응답 과정에서 추가로 준비했던 Appendix 자료와 예상 질문 답변을 실제로 활용할 수 있었는데, 프롬프트에 FFT를 적용하는 원리 및 향후 연구 방향에 대한 질문이 들어왔을 때 준비한 내용을 바탕으로 답변할 수 있어 큰 보람을 느꼈다. 이를 통해 발표에서의 자신감은 단순히 발표 내용을 외우는 데서 나오는 것이 아니라, 예상 질문을 고민하고 연구의 근거를 충분히 준비하는 과정에서 나온다는 것을 깨달을 수 있었다.질문#1. RS 도메인 특화 연구라고 하였는데, 왜 일반화된 주파수 특징 및 멀티스케일 특징을 사용하였는지?답변#1. 추후 RS 이미지뿐만 아니라 일반 이미지나 산업 이미지로도 확장 가능한 연구를 염두에 두었기 때문에, 특정 데이터셋에만 의존하는 특징보다는 보다 일반화 가능한 주파수 특징과 멀티스케일 특징을 활용하고자 하였다. 다만 이러한 특징들이 RS 도메인과 무관한 것은 아니며, RS 이미지는 객체 크기 변화, 배경 잡음, 센서 및 촬영 환경 변화가 크기 때문에 멀티스케일 정보와 주파수 정보가 도메인 강건성에 도움이 될 수 있다는 기존 연구의 근거를 바탕으로 연구를 진행하였다.질문#2. 프롬프트 자체에 FFT를 적용하는 것인지? 그렇다면 어떠한 원리로 동작하는 것인지?답변#2.프롬프트 자체에 FFT를 적용하는 것이 맞다. 기본적인 Visual Prompt Tuning에서는 학습 가능한 프롬프트 토큰이 Transformer Layer를 통과하면서 이미지의 공간적 특징 학습을 유도하게 되는데, 여기에 FFT를 적용하면 프롬프트 임베딩이 공간적 특징뿐만 아니라 저주파 및 고주파와 같은 주파수 영역의 특성까지 함께 반영할 수 있게 되는 원리이다. 따라서 프롬프트가 단순히 이미지의 특정 공간적 위치나 패턴에만 반응하는 것이 아니라 도메인 변화에 상대적으로 강건한 주파수 기반 표현을 함께 학습하도록 유도하는 효과를 기대하였다.질문#3. 향후 연구 방향으로 FFT 비율을 동적으로 조정하는 것을 언급했는데, 더 나아가 주파수 특징이 도메인 일반화에 미치는 영향을 깊게 분석하는 방향은 어떻게 생각하는지?답변#3. 저 역시 해당 방향이 중요하다고 생각하며, 현재 연구에서는 고정된 푸리에 비율을 기준으로 성능 변화를 확인하였지만, 향후에는 주파수 특징이 어떤 도메인 변화에 더 효과적으로 작용하는지, 그리고 저주파와 고주파 성분이 각각 도메인 일반화에 어떤 역할을 하는지 더 깊게 분석할 필요가 있다고 생각한다. 특히, VLM에서는 Vision과 Language라는 서로 다른 modality 간의 gap이 존재하기 때문에, 이를 주파수 관점에서 해석하거나 정렬하는 방향으로 확장한다면 더 의미 있는 연구로 발전할 수 있을 것이라 생각하고 있다.[청취 후기]1. 주파수 대역 분할 캡슐 및 상호주의 집중 메커니즘 기반의 이종 센서 데이터 통합 고장 진단 연구 (임주현 /서울대학교)해당 연구는 진동 신호와 전류 신호를 함께 활용하여 회전 기계의 고장을 진단하는 방법론을 제안한 연구였다. 단일 센서만 사용할 경우 특정 고장 정보를 충분히 포착하지 못할 수 있다는 한계에서 출발하였으며, 기계적 고장 정보가 주로 반영되는 진동 신호와 전기적 이상 정보를 포함하는 전류 신호를 함께 활용하여 보다 정확한 고장 진단을 수행하고자 하였다. 제안 방법론은 진동과 전류 모달리티 간의 상호 관계를 효과적으로 반영하기 위해 크로스 어텐션 기반 라우팅 메커니즘을 적용하였는데, 진동 및 전류 시계열 신호를 STFT를 통해 시간-주파수 스펙트로그램으로 변환한 뒤, 이를 주파수 대역별로 분할하여 각 대역의 고장 관련 특징을 추출하는 방식으로 구성되었다. 이후 각 주파수 대역의 특징을 캡슐 형태로 표현함으로써, 단순한 feature vector가 아니라 각 모달리티와 주파수 대역이 지닌 구조적 정보를 보존하여 최종 고장 분류에 활용하는 방식의 연구를 진행하였다.이 발표를 통해 캡슐 네트워크가 서로 다른 모달리티 간의 정보를 구조적으로 보존하고, 모달리티 간 관계를 반영하는 데 활용될 수 있다는 점을 알 수 있었다. 특히 Vision-Language 모델에서도 서로 다른 모달리티 간의 gap을 줄이는 것이 중요한 문제이기 때문에, 이러한 캡슐 기반 접근이 새로운 관점에서 도움이 될 수 있다고 느꼈다. 최근 읽은 “All You Need is One: Capsule Prompt Tuning with a Single Vector” 논문에서도 캡슐 방식을 활용한 프롬프트 튜닝 아이디어가 제시된 만큼, 캡슐 네트워크가 모달리티 간 표현 정렬이나 프롬프트 튜닝에 어떻게 활용될 수 있는지 더 자세히 살펴보고, 현재 진행 중인 연구에 접목할 수 있는 방향을 고민해보고 싶다.2. Development of a Real-Time Knowledge Retrieval and AI-Driven Recommendation System for the Semiconductor Equipment Academy (기완욱, 김애경, 민경학, 이승봉/ 삼성전자)해당 발표는 기업 내부에서 도메인 특화 LLM 및 AI Agent를 구축하는 과정에서 발생하는 현실적인 문제들을 다룬 발표였다. 현재 범용 LLM이 일반적인 지식이나 상식적인 질문에는 비교적 정확하게 답변할 수 있지만, 반도체 공정, 설비 불량, 특정 라인에서 발생하는 문제처럼 도메인 특화 지식이 필요한 질문에는 충분히 정확한 답변을 제공하기 어려우며, 실제 사내에서는 데이터의 분산성과 보안 및 시스템 제약으로 인해 상용 AI 모델은 쉽게 활용하지 못한다는 말씀을 해주셨다. 실제 기업 내부의 지식은 위키, ERP, 그룹웨어 등 여러 시스템에 흩어져 있으며, 동일한 문제에 대해서도 작성자나 공정 환경에 따라 서로 다른 답변이 존재할 수 있다고 한다. 또한 RAG 기반 시스템을 구축하려 해도 문서 업로드 용량 제한, 인덱스 개수 제한, 보안 검토 절차 등으로 인해 대규모 사내 데이터를 한 번에 활용하기 어렵고, 필요한 문서를 사람이 직접 정리하고 분할해야 하는 경우가 많다고 설명하였다.물론, 프롬프트나 인스트럭션을 세밀하게 설계하면 특정 질문에 대한 답변 성능을 어느 정도 높일 수 있지만, 질문의 범위가 설비, 공정, 교육, 복지 등으로 달라질 때마다 적절한 지시문과 참조 문서가 달라져야 한다는 한계가 있다고 하며 결국 도메인 특화 AI Agent를 실제 산업 현장에 적용하기 위해서는 단순히 좋은 LLM을 사용하는 것만으로는 부족하며, 데이터 정리, 문서 구조화, 검색 시스템, 보안 환경, 전문가 검증까지 함께 고려해야 한다는 점을 강조한 발표였다.이 발표를 통해 LLM 및 AI Agent 연구가 실제 산업 현장에 적용될 때는 모델 성능뿐만 아니라 데이터 관리, 특히 보안과 관련된 운영 환경이 매우 중요한 요소로 작용한다는 점을 알 수 있었다. 특히 연구실에서는 주로 모델 구조, 성능 향상, 방법론의 novelty를 중심으로 문제를 바라보는 경우가 많지만, 실제 기업에서는 보안, 데이터 접근성, 문서 신뢰도, 도메인 전문가의 검증 과정이 모델 활용 가능성을 크게 좌우한다는 점이 인상 깊었다. 현재 나 역시 산업 데이터를 활용한 VLM 및 AI 모델 적용에 관심을 가지고 있는 만큼, 앞으로 연구를 진행할 때 모델 자체의 성능뿐만 아니라 실제 데이터가 어떤 형태로 존재하고, 현장에서 어떻게 활용될 수 있는지까지 함께 고려해야겠다고 느꼈다.
Reviewed by 손병우 손병우
2026.06.09
Read More
09
2026.06

2026 대한산업공학회 춘계학술대회 - 박성수

[학회 후기] 2026년 6월 4일부터 6월 5일까지 경주 화백컨벤션센터에서 진행된 2026 대한산업공학회 춘계학술대회에 참가하였다. 오랜만에 학회에 참가하여 설레는 마음이 컸다. 다양한 연구자들이 어떤 연구를 진행하고 있고, 현재 어떤 연구 흐름이 있는지 파악할 수 있었다. 나는 시계열 예측을 연구하고 있기 때문에, 이번 학회에서 시계열 예측 관련 발표들을 특히 관심 있게 살펴보았다. 학회에서 여러 발표를 들으며 연구의 방향성을 설명하는 방식에 대해서도 많은 것을 느꼈다. 좋은 발표는 방법론을 보여주는 것이 아니라, 왜 이 문제가 중요한지, 기존 방법에는 어떤 한계가 있는지, 제안한 방법이 그 한계를 어떻게 보완하는지를 명확하게 전달하고 있었다. 이를 보며 나의 연구 역시 방법론 자체를 설명하는 것 이외에 연구가 해결하고자 하는 문제의 필요성과 의미를 더 분명하게 전달해야겠다고 생각했다. 이번 학회에서는 나의 연구를 다른 연구자들 앞에서 공유할 수 있었다는 점에서도 의미가 컸다. 발표를 준비하는 과정에서 내가 수행한 연구의 핵심 아이디어를 다시 정리할 수 있었고, 발표 이후에는 연구를 더 발전시키기 위해 어떤 부분을 보완해야 할지 생각해볼 수 있었다. [발표 후기] 이번 2026 대한산업공학회 춘계학술대회에서 “패턴 중심 유사도 검색과 시계열 분해를 활용한 다변량 시계열 예측 방법론”을 주제로 구두 발표를 진행하였다. 본 연구는 다변량 시계열 예측 문제에서 기존 모델들이 고정된 lookback window에 의존하기 때문에, 복잡하고 드물게 반복되는 패턴을 제대로 예측하기 못한다는 한계가 있다. 이에 본 연구에서는 현재 입력 시계열과 유사한 과거 패턴을 memory bank에서 검색하고, 그 과거 패턴 이후의 실제 미래 구간을 활용하여 예측을 보완하는 retrieval 기반 구조를 제안하였다. 발표를 준비하고 진행하면서 가장 크게 느낀 점은 연구 내용을 잘 아는 것과 그것을 청중에게 명확하게 전달하는 것은 별개의 문제라는 점이었다. 연구를 수행하는 동안에는 방법론의 세부 구조와 실험 결과에 집중하게 되지만, 발표에서는 청중이 문제의식부터 자연스럽게 따라올 수 있도록 흐름을 구성하는 것이 중요했다. 특히 왜 과거 유사 패턴을 검색해야 하는지, 검색된 정보가 어떤 조건에서 도움이 되는지, 그리고 제안 방법론의 장점과 한계가 무엇인지를 균형 있게 설명하는 과정이 중요하다는 것을 배웠다. 또한 첫 구두 발표였기 때문에 발표 전에는 긴장감이 컸지만 실제로 발표를 진행하면서 내가 연구한 내용을 다른 연구자들 앞에서 직접 설명한다는 점에서 보람을 느꼈다. 포스터 발표와 달리 구두 발표는 제한된 시간 안에 연구 배경, 방법론, 실험 결과, 결론을 하나의 흐름으로 전달해야 했기 때문에 부담도 있었지만, 그만큼 연구의 핵심을 정리하는 데 많은 도움이 되었다. 발표를 준비하는 과정에서 내가 제안한 방법론의 핵심 기여가 무엇인지, 어떤 부분을 더 명확하게 설명해야 하는지 다시 점검할 수 있었다. 이번 발표를 통해 앞으로의 연구 방향에 대해서도 많은 생각을 하게 되었다. 특히 retrieval 정보를 단순히 가져오는 것을 넘어, 검색된 과거 정보가 실제로 현재 예측에 유용한지 더 정교하게 판단하는 과정이 필요하다고 느꼈다. 또한 복잡한 시계열 데이터에서 유사도를 어떻게 정의할 것인지, 과거 유사 패턴과 미래 전개의 관계를 어떻게 더 안정적으로 모델링할 것인지에 대한 고민도 이어가야 한다고 생각했다. 질문 1: 복잡한 예측하기 어려운 시계열은 어떤 것으로 판단할 수 있나요? 답변 1: 시계열의 복잡성은 예측 불가능성으로 판단할 수 있습니다. 이를 수치화하는 대표적인 지표가 Sample Entropy입니다. Sample Entropy는 길이 m인 과거 패턴이 주어졌을 때, 다음 값까지 포함한 패턴이 얼마나 다르게 나타나는지를 측정합니다. 값이 높을수록 과거 패턴으로 미래를 예측하기 어렵다는 의미입니다. 질문 2: 전체 시계열에서 복잡한 패턴이 있는 구간에서 성능이 좋았나요? 답변 2: 실제 데이터에서 복잡성이 높은 구간을 찾고, 해당 구간에서 저의 방법론의 성능을 확인하여 추가 검증을 할 예정입니다. 질문 3: crossformer같은 기존 예측 모델도 해당 유사한 문제 상황을 해결하기 위해 나왔는데, 굳이 이 방법을 구상하신 이유가 있을까요? 답변 3: 기존의 Crossformer와 같은 모델들은 복잡한 아키텍처를 통해 데이터 내의 의존성을 학습하려 했으나, 여전히 모델의 가중치라는 한정된 메모리에만 의존한다는 한계가 있습니다. 제 방법론은 이를 극복하기 위해 학습으로 해결하기 어려운 희귀 패턴이나 비정상적 움직임을 전체 과거 데이터에서 직접 검색하여 모델에 힌트로 제공하는 방식을 선택했습니다. 질문 4: 방법론에서 사용하신 iTransformer 이외에 다른 모델도 사용할 수 있나요? 답변 4: 네, 가능합니다. 저의 방법론은 model-agnostic한 방법이기 때문에 다른 모델에도 저의 방법론을 같이 사용해서 성능을 검증해볼 예정입니다. [청취 후기] (1) Light Weight Quantum Autoencoder for Multivariate Time-Series Anomaly Detection (김하람/연세대학교) “다변량 시계열 이상 탐지를 위한 경량 양자 오토인코더” 구두 발표를 청취하였다. 해당 연구는 산업 현장에서 시계열 이상 탐지의 중요성이 커지고 있는 상황에서, 기존 딥러닝 기반 오토인코더가 많은 파라미터와 연산량을 요구한다는 한계를 문제로 제기하였다. 이를 해결하기 위해 양자 오토인코더를 활용하였으며, 특히 기존 QAE가 다변량 시계열 데이터를 단순히 평탄화하여 인코딩함으로써 시간적 순서와 변수 구조를 충분히 반영하지 못한다는 점을 개선하고자 하였다. 발표에서 제안한 Light Weight QAE는 RNN의 순차 처리 방식에서 아이디어를 가져와서 각 레이어가 시간 스텝에 대응되도록 구성하고 각 큐비트가 하나의 피처를 담당하도록 설계되었다. 이를 통해 시계열의 순차적 흐름과 변수 구조를 보존하면서도 회로 깊이와 파라미터 수를 크게 줄일 수 있었다. 특히 기존 QAE나 고전 오토인코더와 유사한 성능을 유지하면서도 훨씬 적은 파라미터로 동작한다는 점이 인상적이었다. 이 발표를 들으며 이상 탐지 모델을 평가할 때 단순히 성능 지표만 볼 것이 아니라, 실제 하드웨어 환경에서 실행 가능한지, 모델이 데이터의 구조를 얼마나 잘 보존하는지까지 함께 고려해야 한다는 점을 배웠다. 또한 다변량 시계열 데이터를 다룰 때 시간 순서와 변수 간 구조를 어떻게 모델 안에 반영할 것인가는 매우 중요한 문제라는 점을 다시 느꼈다. 내가 연구하는 시계열 예측 문제에서도 성능을 위해 모델의 크기를 키우는 것보다 시계열 데이터의 특성을 반영한 설계가 중요하다는 생각을 하게 되었다. (2) 이질적 텍스트 속성 그래프를 위한 메타패스 기반 그래프 신경망 프레임워크 (황영석/서울대학교) “이질적 텍스트 속성 그래프를 위한 메타패스 기반 그래프 신경망 프레임워크” 포스터 발표를 청취하였다. 이 발표를 관심 있게 본 이유는 시계열 예측 분야에서도 GNN을 활용하여 변수 간 관계나 시공간적 의존성을 모델링하는 연구가 많이 이루어지고 있기 때문이다. 내가 연구하는 다변량 시계열 예측에서도 각 변수를 하나의 노드로 보고, 변수 간 상관관계나 유사한 변화 패턴을 엣지로 정의할 수 있기 때문에, 이질 그래프와 메타패스 개념이 시계열 예측에도 확장될 수 있을지 궁금했다. 해당 연구는 그래프 구조와 텍스트 속성을 함께 가지는 이질 텍스트 속성 그래프에서, 어떤 메타패스가 의미 있는 관계를 나타내는지를 판단하는 방법을 제안하였다. 기존 방법들이 사전에 정의된 메타패스나 label 정보에 의존하는 경우가 많았다면, 이 연구는 노드의 텍스트 임베딩 유사도를 활용하여 label 없이도 의미적으로 유효한 메타패스를 선택하고, 이를 GNN 학습에 반영하고자 하였다. 그래프의 연결 여부만 보는 것이 아니라, 연결된 노드들이 의미적으로도 유사한지를 함께 고려한다는 점이 인상적이었다. 이 발표를 들으며 시계열 예측에서도 비슷한 아이디어를 적용할 수 있겠다는 생각을 하였다. 예를 들어 다변량 시계열에서 변수 간 관계를 단순한 상관계수로만 정의하는 것이 아니라, 각 변수의 시계열 패턴 임베딩을 활용하여 실제로 의미 있는 관계를 선별할 수 있을 것 같았다. 또한 센서, 설비, 공정 단계, 시간 지연 관계처럼 서로 다른 유형의 노드와 관계가 존재하는 산업 시계열 데이터에서는 이질 그래프 구조를 구성하고, 메타패스 개념을 활용하여 “어떤 관계 경로가 예측에 유용한가”를 판단할 수 있을 것이라고 생각했다. 특히 내가 연구하고 있는 패턴 중심 시계열 예측 관점에서도, 과거 유사 패턴을 검색할 때 단순히 시계열 간 유사도만 보는 것이 아니라 변수 간 구조적 관계까지 함께 고려한다면 더 정교한 검색이 가능할 수 있다. 예를 들어 특정 변수의 패턴이 다른 변수의 변화와 시간차를 두고 연결되는 경우, 이러한 관계를 그래프 형태로 표현하고 GNN을 활용해 예측에 반영할 수 있을 것이다. 이를 통해 개별 시계열의 패턴을 찾는 것뿐만 아니라 변수들 사이의 관계 구조까지 고려한 시계열 예측 방법론으로 확장할 수 있겠다는 아이디어를 얻었다.
Reviewed by 박성수 박성수
2026.06.09
Read More
08
2026.06

2026 대한산업공학회 춘계학술대회 - 송하영

[학회 후기]2026년 6월 4~5일 경주에서 개최된 대한산업공학회 춘계학술대회에 참가하여 구두 발표를 진행하였다.인생 첫 학회 발표였기에 긴장도 되었지만, 연구실에서 충분히 준비한 덕분에 자신감을 가지고 발표에 임할 수 있었다. 발표 이외에도 다양한 발표 및 포스터를 보면서 많은 연구적 교류를 했던 것이 기억에 남는다. 연구적 동향으로 봤을때는 단연 VLM 기반 연구가 많았으며, 강화학습, 생성형 모델 및 LLM 등 다양한 최신 인공지능 모델들을 통해 실제 산업 문제에 적용하려는 시도가 많았다. 또한 포스터 세션에서는 일부러 외국인 연구자들의 발표를 영어로 들으며 본인 또한 답변으로 영어를 하며 많은 교류를 하려 노력했다. 비록 생각만큼 자연스럽게 의사소통하지는 못했지만, 영어 실력의 중요성을 다시 한 번 절실하게 느끼는 계기가 되었다.이번 학회를 통해 느낀 큰 키워드는 아래와 같이 세 가지로 정리해 볼 수 있을 것 같다.1. 연구는 전달까지 포함되어야 한다.아무리 좋은 연구를 수행하더라도 상대방을 설득하고 이해시키지 못하면 연구의 가치가 충분히 전달되지 않는다. 이번 학회에서 다양한 발표를 들으며 특히 이 점을 강하게 느꼈다. 연구의 수준뿐 아니라 발표 자료의 구성, 스토리텔링, 시각화, 전달 방식이  연구 평가에 상당한 영향을 미친다는 것을 체감하였다.2. 영어는 선택이 아닌 필수이다.해외 저널과 국제 학회를 목표로 연구를 수행하는 입장에서 영어는 더 이상 선택이 아니다. 포스터 세션에서 외국인들과 영어로 교류하면서 느낀 점은 논문을 읽고 쓰는 것뿐만 아니라 연구를 설명하고 토른하는 능력 또한 중요하며, 실제로 한 외국인 연구자와 토론하는 과정에서 내 연구를 영어로 설명하는데 있어서 소통의 한계를 느꼈다. 앞으로는 비용을 투자해서라도 꾸준히 영어 회화를 향상시켜야겠다고 느꼈다.    3. 생각을 논리적으로 정리하는 연습이 필요하다.책을 많이 읽고 다양한 분야의 지식을 접하는 것도 중요하지만, 평소 자신의 생각을 논리적으로 정리하여 상대방에게 간결하게 전달하는 역시 연구자에게 매우 중요하다는 것을 느꼈다.이번 학회는 연구자로서 앞으로 어떤 부분을 보완해야 하는지 명확하게 인식하게 해준 뜻깊은 경험이었다. 또한 동기 및 선배들과 함께 학회에 참여하여 더욱 가까워질 수 있었고, 특히 우리 동기들은 신입생의 티가 하나도 나지 않을 정도로 발표를 정말 수준있게 임한점에서 정말 멋졌고, 선배들의 발표는 학회내에서도 두드러질 정도로 노련한 것이 느껴졌다.[발표 후기]이번 학회에서는 “확산 모델 기반 역문제에서의 사후 분포 탐색 개선” 이라는 주제로 구두 발표를 하였다. 해당 연구는 기존 Diffusion model 기반 역문제 연구들은 관측값과의 정합성은 잘 만족시키지만, 사후 분포(Posterior distribution)에서는 다양성을 충분히 반영하지 못한다는 한계를 문제로 삼으며, 본 연구에서는 이러한 문제를 해결하기 위해 Colorization 문제를 대표적인 예시로 사용하였다. Colorization은 하나의 흑백 이미지에 대해 다양한 정답이 존재할 수 있기 때문에 사후 분포의 다양성을 평가하기에 적합한 과제이다.기존 방법론들이 다양성을 충분히 반영하지 못하는 사례를 제시한 뒤, 이를 개선하기 위한 접근법으로 Noise Conditional Score Network(Song et al., Neurips 2019)에서 영감을 받아 노이즈가 존재하는 외부 분포에서부터 Posterior Langevin Dynamics를 수행하는 방법론을 제안하였다. 이를 통해 Pixel-space Diffusion model에서 기존 방법론 대비 우수한 다양성과 복원 성능을 달성할 수 있었다.질문#1. gaussian noise를 어느정도 입혔는지와 posterior langevin dynamics는 몇번했는지 ?답변#1. gaussian noise level을 총 20개로 설정하였으며, 각 noise level마다 posterior langevin dynamics를 50회 수행하였다. 따라서 총 1,000회 수준의 langevin update가 수행되며, 추가적인 연산은 gradient 계산 과정에서 발생한다.질문#2. 서로 다른 gaussian 분포 사이를 이동할 때 상태는 어떻게 업데이트 되는가?답변#2. 각 noise level에서 현재 상태 xt를 관측값 방향으로 먼저 보정한 뒤, 해당 위치에서 x0hat을 예측한다. 이후 예측된 x0hat을 활용해 다음 noise level의 상태를 구성한다. 이를테면 x0hat에서 xt-1만큼의 noise를 다시 입힘으로 구성한다. 따라서 각 gaussian 분포에서의 업데이트는 독립적으로 수행되면서도 관측값 방향으로 지속적으로 유도된다.질문#3. 기존 방법론과 대비해 시간적인 측면에서 고려했는지?답변#3. DAPS 대비 backprogation이 더 들어가기때문에 시간은 더 소요된다. 이를테면, 관측값으로 당겨주는 미분에서 daps에서는 x0hat을 x0hat에 대해 직접 미분하지만 제안 방법론은 x0hat을 xt에 대해 미분하기때문에 그에 따른 차이가 존재한다.질문4. Colorization 성능 이외에도 Deblur나 Super resolution에 대한 성능이 있었는지? 본 방법론은 다양성을 향상시켜려한 연구인데 어떻게 Deblur나 Super resolution에 대한 성능 향상이 되었는지 ?답변#4. Colorization 뿐만 아닌 Deblur와 Super resolution과 같은 방법에서도 일관적으로 성능 향상을 확인하였다. 본 연구는 단순히 다양성을 증가시키는 것을 넘어서 사후 분포를 다양성을 넓게 탐색하면서도 의미 있는 모드를 정교하게 추적하기 때문에 복원 품질 또한 함께 향상시켰기에 Deblur와 Super resolution에서도 성능 향상을 이룰 수 있다.[청취 후기]1. Flatness-Aware Stochastic Gradient Langevin Dynamics (Stefano Bruno, UNIST)해당 연구는 2026 ICML accept paper로 Stochastic Gradient Langevin Dynamics(SGLD)가 낮은 loss만 찾는 대신, 낮은 loss + flat한 영역을 선호하도록 수정한 fSGLD를 제안하고, 이 방법론이 이론적으로 flatness-biased Gibbs distribution음 샘플링함을 수학적으로 증명하였으며, 해당 연구에서 관심이 가는 부분은 단순히 낮은 loss를 찾는 것이 아닌, 낮은 loss이면서 Hessian curvature가 낮은 즉, flat한 영역에 더 자주 머물도록 SGLD 방법를 바꾼 방법이라는 점에서 많은 관심이 갔다.처음에는 내 방법론 또한 posterior langevin dynamics 관점에서 진행하기에 키워드가 비슷해서 들으러 갔다가 이러한 flatness-aware 방식을 적용해볼수있지않을까라는 생각이 들었으며 해당 발표자와 더 네트워킹을 진행해보고 싶다는 생각이 들었다. 해당 방법론을 들으며 특히 내 방법론은 posterior langevin dynamic 관점에서 gaussian smoothing을 적용하는 방식인데, 해당 연구와 내 연구는 분포를 어떻게 바라볼까에 대한 관점에서의 연결점은 분명 존재할 것이며 이런 연결점을 더 깊게 탐구한다면 현재 연구를 보다 이론적으로 발전시킬 수 있을 것이라는 영감을 얻었다. 발표자분이 현재 박사 후 연구원 과정으로 연구를 잔행하시는 것으로 알고있는데, 이런 깊이 있는 연구를 소개해주신 점에 대해 다시 한 번 감사함을 표한다.2. Diffusion Model을 활용한 Unseen Wafer Map Defect Detection (고동현, 국립한국교통대학교 / poster)해당 연구는 Diffusion Model을 활용하여 Wafer Map 데이터를 생성하고, In-Distribution 영역을 확장함으로써 OOD 탐지 성능을 향상시키고자 하였다. 기존 Wafer Map에 변형을 가한 뒤 Diffusion 과정을 통해 새로운 샘플을 생성하고, 이를 활용하여 정상 데이터 분포의 경계를 넓게 학습시키는 아이디어였다.질문 #1. 본질적으로 OOD Detection 문제를 해결하기보다는 In-Distribution 영역을 확장하는 접근에 가까운 것 아닌가?답변 #1. 이는 본 연구가 가진 본질적인 한계 중 하나이며 이 부분에 대해 더욱 깊이 있는 고민을 하겠다.질문 #2. 비교 방법으로 DCGAN을 사용한 이유는 무엇인가? Diffusion model이 성능상 우위를 가질것으로 예상이 되는데, 비교의 타당성이 있는가?답변 #2. 초기 연구는 DCGAN 기반으로 진행되었으며, 이후 공동지도교수님의 조언을 받아 Diffusion model 기반으로 확장하였다. 연구 발전 과정을 보여주기 위해 비교 실험에 포함하였다.3. Comparison Analysis of Photovoltaic Prediction in Different Timeframes Using Observation Data: A Case Study of Horus Energy PV Solar Plant in Guatemala (Yul A(Elisa) Kim, The State of University of New York, Korea / poster)해당 연구는 과테말라 Horus Energy 태양광 발전소에서 수집한 관측 데이터를 활용해 예측 시간 구간에 따른 태양광 발전량 예측 성능을 비교분석한 연구이며, 다양한 머신러닝 모델을 적용하여 예측 성능을 비교하였으며, 하이퍼파라미터 튜닝을 통해 최적의 성능을 도출함을 보여준 연구이다. 해당 연구는 실제 발전소 데이터를 활용했다는 점이 인상적이었다.질문 #1. 현재 보이는 성능들은 전반적으로 전통 ML 및 Boost 계열 모델들로 보이는데 딥러닝 기반 모델로의 확장은 고려하시지 않는지? 현재 설명을 들었을때는 데이터 형식은 tabular로 보이는데 tabnet과 같은 모델을 활용해도 좋아보인다.답변 #1. 현재는 머신러닝 모델 중심으로 분석하였으며, 향후 연구에서 딥러닝 모델에 대해서도 추가 확장 계획을 가지고 있다.이번 학회는 위와 같은 경험들로 인해 단순히 발표 경험을 넘어 연구자로서 부족한 점과 앞으로 발전시켜야 할 방향을 명확하게 인식하게 해준 의미 있는 시간이었다. 특히 연구를 전달하는 능력, 영어 소통 능력, 그리고 연구 아이디어를 연결하고 확장하는 능력이 앞으로의 성장에 중요한 요소라는 점을 다시 한 번 깨달을 수 있었다.
Reviewed by 송하영 송하영
2026.06.08
Read More
08
2026.06

2026 대한산업공학회 춘계학술대회 - 김정인

[학회후기]2026년 6월 4일부터 5일까지 경주에서 개최된 대한산업공학회 춘계학술대회에 참여하였다. 이번 학회는 단순히 다양한 연구를 접하는 자리를 넘어, 연구실 안에서 익숙하게 바라보던 나의 연구를 외부의 시선에서 다시 점검해볼 수 있었던 시간이었다. 평소에는 모델의 구조나 성능을 개선하는 데 집중했다면, 학회에서는 연구가 어떤 문제에서 출발했으며 실제로 누구에게 어떠한 가치를 줄 수 있는지를 더 많이 생각하게 되었다. 여러 발표를 들으며 가장 인상 깊었던 점은 연구마다 문제를 풀어가는 방식이 매우 다르다는 것이었다. 동일한 인공지능 기술도 제조, 배터리, 물류, 게임 등 적용되는 분야에 따라 필요한 가정과 평가 기준이 달라졌다. 이를 보며 새로운 모델을 만드는 것만큼, 연구 대상에 대한 이해를 바탕으로 적절한 문제를 설정하는 것이 중요하다는 생각이 들었다. 또한 발표자들이 자신의 연구를 제한된 시간 안에 설명하는 모습을 보면서, 많은 내용을 전달하기보다 연구의 핵심 메시지를 명확히 남기는 것이 좋은 발표의 중요한 요소라는 점도 배울 수 있었다. 이번 학회를 통해 완성된 연구 결과를 확인하기보다, 앞으로 내가 어떤 연구자가 되어야 할지 생각해보게 되었다. 단순히 높은 성능을 제시하는 연구가 아니라, 실제 문제와 연결되고 연구의 필요성을 분명하게 설명할 수 있는 연구를 하고 싶다는 목표가 더욱 명확해졌다. 연구실 구성원들과 함께 발표를 듣고 의견을 나누었던 경험 역시 혼자서는 발견하기 어려운 새로운 관점을 얻는 데 도움이 되었다. 이번 학회에서 얻은 질문과 고민을 앞으로의 연구 과정에 반영하며, 나만의 문제의식이 담긴 연구를 만들어가고 싶다.[발표 후기]이번 학회에서는 "역할 정보를 반영한 시간적·협력적 의존성 모델링 기반 다중 에이전트 선호 기반 강화학습"을 주제로 연구 결과를 발표하였다. 강화학습에서는 효과적인 보상 함수를 설계하기 위해 많은 시간과 비용이 요구된다는 한계가 있다. 이를 해결하기 위한 방법으로 선호 기반 강화학습이 제안되었으며, 지금까지는 주로 단일 에이전트 환경을 중심으로 활발한 연구가 이루어져 왔다. 그러나 이를 다중 에이전트 환경으로 확장하기 위해서는 전체 보상에 대한 각 에이전트의 기여도를 구분하는 credit assignment 문제를 함께 고려해야 한다. 기존 다중 에이전트 강화학습 연구에서는 에이전트의 역할 정보를 활용하는 것이 이러한 문제를 완화하는 데 효과적인 것으로 보고되어 왔다. 이에 본 연구에서는 에이전트의 역할 정보를 반영하여 시간적·협력적 의존성을 학습하는 다중 에이전트 선호 기반 강화학습 방법론을 제안하였다. 실험 결과, 역할 정보를 반영한 방법이 기존 방법보다 향상된 성능을 보였으며, 이를 통해 다중 에이전트 선호 학습에서 역할 정보의 활용 가능성과 효과를 확인하였다.질문1: 동일한 유닛이 있을 때, 역할이 어떻게 작용하나요?동일한 종류의 유닛이라 하더라도, 상황과 협력 방식에 따라 어떤 에이전트는 적의 공격을 유도하고, 다른 에이전트는 실제 공격을 수행하는 등 서로 다른 역할을 맡을 수 있습니다.질문2: 제안한 방법론에는 여러 하이퍼파라미터가 사용된 것으로 보이는데, 최적의 값을 찾는 과정에서 어려움은 없었나요? 또한 하이퍼파라미터를 조정하며 느낀 점이 있다면 말씀해 주실 수 있을까요?제가 제안한 방법론에서 주요하게 고려한 하이퍼파라미터는 K-means 군집화의 군집 수인 kkk입니다. 적절한 kkk 값을 선정하기 위해 여러 설정으로 실험을 진행했지만, 핵심적으로 조정해야 할 하이퍼파라미터가 하나뿐이었기 때문에 탐색 과정이 크게 어렵지는 않았습니다. 물론 연구에 따라 여러 하이퍼파라미터를 동시에 조정해야 하는 경우에는 상당한 어려움이 있을 수 있지만, 본 연구에서는 하이퍼파라미터 조정이 큰 한계로 작용하지는 않았습니다.[청취 후기](1) 불확실성을 고려한 반도체 생산라인 스케줄링 파라미터 동적 제어 (오동윤 / KAIST)이 발표를 들으며 가장 먼저 떠오른 생각은 인공지능을 산업 현장에 적용할 때 반드시 기존 시스템 전체를 대체해야 하는 것은 아니라는 점이었다. 발표에서는 반도체 생산라인에서 이미 사용되고 있는 규칙 기반 스케줄링 구조를 유지하면서, 엔지니어가 수작업으로 조정하던 파라미터만 강화학습으로 제어하였다. 새로운 알고리즘으로 기존 운영 방식을 완전히 바꾸기보다, 사람이 반복적으로 수행하던 의사결정 영역을 찾아 자동화했다는 점에서 실제 현장 적용을 세심하게 고려한 연구라고 느꼈다. 특히 생산 공정을 공정 단계별 노드와 설비 경쟁 관계를 나타내는 그래프로 표현한 부분이 흥미로웠다. 반도체 생산라인은 공정의 수와 구조가 달라질 수 있기 때문에 특정 크기의 입력만 처리하는 모델은 활용 범위가 제한될 수 있다. 반면 그래프 기반 구조를 활용하면 작은 생산 환경에서 학습한 모델을 더 큰 환경에 적용할 가능성이 생긴다. 이를 통해 모델의 성능뿐만 아니라 환경이 변화했을 때에도 적용 가능한 구조를 설계하는 것이 중요하다는 점을 다시 생각하게 되었다. 무엇보다 이 연구는 강화학습이 작업 자체를 직접 수행하는 데만 사용되는 것이 아니라, 기존 의사결정 시스템의 운영 방식을 실시간으로 조정하는 상위 제어기로도 활용될 수 있음을 보여주었다. 나 역시 강화학습 연구를 진행할 때 새로운 정책의 성능 향상에 집중하는 경우가 많았는데, 이번 발표를 통해 실제 시스템에서 사람이 어떤 부분을 반복적으로 조정하고 있는지 먼저 살펴보는 것이 좋은 연구 문제를 발견하는 출발점이 될 수 있다고 느꼈다.(2) GuidelineAD: 시각-언어 모델 기반 검사 지침을 활용한 무학습 이상 탐지 (허재혁 / 서울대학교)이 발표를 들으며 이상 탐지를 단순히 정상과 비정상을 구분하는 문제로만 바라보아서는 안 된다는 생각이 들었다. 실제 검사 현장에서는 모델이 비정상이라고 판단했다는 사실만큼이나, 어떤 검사 기준에서 문제가 발견되었는지를 설명하는 것이 중요하다. GuidelineAD는 정상 이미지에서 표면 상태, 색상 균일성, 구조적 대칭성과 같은 검사 관점을 추출하고, 이를 구체적인 가이드라인으로 변환한 뒤 각 기준의 충족 여부를 평가하였다. 즉, 하나의 이상 점수를 바로 예측하는 대신 사람이 제품을 검사하듯 여러 기준을 차례로 확인하도록 구성한 점이 인상적이었다. 특히 가이드라인을 한 번 생성하고 그대로 사용하는 것이 아니라, 여러 후보를 만든 뒤 별도의 정상 이미지로 품질을 검증하여 대표 가이드라인을 선택한 과정이 흥미로웠다. 생성형 모델이 만든 문장은 자연스럽게 보이더라도 실제 검사 기준으로 항상 유용한 것은 아니기 때문에, 생성과 검증을 분리한 설계가 연구의 신뢰성을 높였다고 생각한다. 또한 여러 가이드라인의 Yes와 No 응답을 단순 투표로 결합하지 않고 토큰 확률을 연속적인 이상 점수로 변환한 점도, 언어모델의 출력을 정량적 판단에 활용하는 방법을 보여주었다. 이 연구를 보며 앞으로의 이상 탐지 모델은 높은 정확도만으로 평가되기보다, 검사 기준을 스스로 구성하고 그 기준에 따라 판단 근거를 제공하는 방향으로 발전할 수 있겠다고 느꼈다. 동시에 모델이 생성한 설명이 실제 이상 원인과 일치하는지 검증하는 문제도 중요하다고 생각했다. 탐지 성능은 우수하지만 설명이 부정확하다면 사용자는 오히려 모델을 신뢰하기 어려울 수 있기 때문이다. 따라서 이상 탐지와 설명 생성을 하나의 기능으로 결합하는 것을 넘어, 설명의 정확성까지 평가하는 연구가 후속 과제로 이어질 수 있겠다는 생각이 들었다.
Reviewed by 김정인 김정인
2026.06.08
Read More
08
2026.06

2026 대한산업공학회 춘계학술대회 - 안채원

[학회 후기] 2026 대한산업공학회 춘계학술대회가 6월 4일부터 5일까지 경주에서 열렸다. 학회에 처음 참석하는 것이라 어떤 분위기일지 궁금하기도 하고 설레기도 했다. 막상 와보니 생각보다 훨씬 다양한 분야의 연구들이 발표되고 있었고, 특히 LLM, VLM 등을 활용한 연구들이 학계뿐만 아니라 현직자들 사이에서도 활발하게 다루어지고 있다는 점이 인상적이었다. 현직자들의 발표를 들으면서는 내가 연구실에서 다루는 문제들이 실제 산업에서 어떤 형태로 쓰일 수 있을지 처음으로 구체적으로 그려볼 수 있었다. 아직은 연구의 큰 그림보다 눈앞의 실험에 집중하고 있는 단계라, 이렇게 넓은 시각으로 문제를 바라보는 분들의 발표가 자극이 되었다. 이번 학회를 통해 내가 하고 있는 연구가 어떤 흐름 위에 있는지를 조금이나마 느낄 수 있었고, 앞으로 어떤 질문을 가져가야 할지 고민해보는 계기가 되었다. [발표 후기] 이번 발표에서는 "유사 객체가 많은 환경에서 비디오 객체 분할을 위한 SAM3 메모리 개선"이라는 주제로 연구를 소개하였다. 본 연구는 SAM3 tracker가 유사한 외형의 방해꾼(distractor)이나 occlusion 상황에서 drift가 발생하는 문제에 주목하였다. 기존 SAM3는 VOS task에서 tracker만을 활용하기 때문에 이러한 상황에서 한번 drift가 발생하면 이를 복구하기 어렵다는 한계가 있었다. 이에 본 연구에서는 tracker의 방해꾼 의심 신호를 트리거로 detector를 호출하는 이중 검증 전략과, occlusion 직후 일정 frame의 메모리 저장을 유예하는 전략을 제안하였다. 발표를 준비하고 진행하면서, 각 전략이 왜 필요한지를 청중에게 더 직관적으로 전달하는 것이 중요하다는 점을 느꼈다. 이를 통해 앞으로 연구의 동기와 흐름을 더 설득력 있게 정리해야겠다는 생각을 하게 되었다. 질문 1: occlusion 직후 skip하는 frame 수가 5인데, 너무 짧은 것 아닌가? 답변 1: 실험에 사용한 데이터셋은 5fps 단위로 샘플링된 것이기 때문에, skip 5는 원본 영상 기준으로 약 25frame에 해당하는 구간입니다. 표면적인 숫자는 작아 보이지만 실제 시간 축 상에서는 충분한 유예 구간이 확보됩니다. 질문 2: 방해꾼과 occlusion이 동시에 발생하는 등 더 복잡한 상황에서는 어떻게 대처할 것인가? 답변 2: 현재 방법은 SAM3가 추적 초기와 occlusion이 발생하지 않는 구간에서 안정적으로 동작한다는 가정에 기반하고 있어, 복합적인 시나리오에서는 한계가 있을 수 있습니다. 향후 target과 방해꾼의 위치 및 장면 맥락 정보를 MLLM에 전달하여 더 유연하게 대처하는 방향을 계획하고 있습니다. [청취 후기] 1. Cliff Tokens: Where and Why Mathematical Reasoning Falls Off (고재영 / 서울대학교, poster) 해당 연구는 LLM의 수학적 추론 과정에서 성능이 급격히 저하되는 지점인 cliff token을 정의하고, 이를 탐지 및 분류하는 방법론을 제안한 연구였다. 단순히 정답률을 높이는 방향이 아니라, 추론 실패가 어디서 어떻게 발생하는지를 token 수준에서 파고든다는 접근이 흥미로웠다. token-wise potential이 이전 시점 대비 크게 낮아지는 지점을 z-test 기반 adaptive threshold로 감지하고, deterministic, uncertain, sampled-off의 세 유형으로 분류하는 cliff taxonomy를 제안하였다. 같은 모델 계열 내에서도 스케일에 따라 taxonomy 분포가 달라진다는 분석은, 단순한 스케일업이 추론 안정성을 보장하지 않는다는 점을 시사하고 있어 인상적이었다. 나아가 cliff token 위치에 직접 DPO 감독 신호를 부여하는 Cliff-DPO를 통해 실제 벤치마크 성능 향상까지 보여준 점에서, 분석에서 그치지 않고 실용적인 방향으로 연결한 흐름이 자연스럽게 느껴졌다. 모델이 틀리는 순간을 내부적으로 포착한다는 발상 자체가 인상 깊었고, 내 연구에도 유사한 시각을 적용해야겠다는 생각이 들었다. 2. Hardware-Efficient Optimization: GCG-Specialized Triton Kernels for 4-bit LLMs (최준혁, 한성원 / 고려대학교, poster) 해당 연구는 4-bit quantized LLM 환경에서 GCG 공격을 효율적으로 수행하기 위한 Triton 기반 커널 최적화 방법을 제안한 연구였다. GCG는 모델이 유해한 답변을 유도하는 suffix를 자동으로 탐색하는 공격 기법인데, 이를 실제로 수행하려면 막대한 GPU 메모리와 연산량이 필요하다는 현실적인 한계가 있다. 해당 연구에서는 GCG 연산의 특수성을 활용하여 출력 KV 캐시 저장 방식을 개선하고, NF4-STE, GCG-FA 등을 적용함으로써 fp16 대비 VRAM 사용량을 63% 줄이면서도 유사한 공격 성공률을 유지하는 결과를 보여주었다. 학부에서 보안 전공을 다뤘던 터라 LLM 보안과 관련한 연구에 자연스럽게 눈이 갔고, 공격 기법 자체의 효율화라는 관점에서 접근했다는 점이 특히 흥미로웠다. 덕분에 포스터 앞에서 발표자와 더 깊이 이야기를 나눌 있었고, 보안과 LLM이 교차하는 지점에서 앞으로 어떤 연구들이 나올 수 있을지 생각해보는 계기가 되었다.
Reviewed by 안채원 안채원
2026.06.08
Read More
08
2026.06

2026 대한산업공학회 춘계학술대회 - 정재우

[학회후기]6월 4일부터 5일까지 진행된 2026년 대한산업공학회에 참여하였다. 우리 DMQA 연구원들은 전날 6월 3일에 경주로 내려가 발표 준비를 수행하였으며, 적당한 회식을 통해 연구원들의 사기를 도모하는 시간을 가졌다. 6월 4일, 본격적으로 학회 등록과 동시에 학회 세션이 시작되었으며, 생각보다 큰 규모와 많은 참여 인원에 압도되었고, 자연스럽게 학술적 토론과 발표를 경청하는 분위기가 형성되었다. 또한 놀라웠던 점은, 산업 공학회임에도 불구하고, 대부분의 발표와 포스터가 산업에 AI를 접목하거나 사용한 어플리케이션 관련 연구였다. 이러한 연구 동향을 몸소 느낄 수 있었고, 여러 산업 도메인과 테스크에 AI가 활용되는 것을 목격하며 차세대 산업 시장에서 경쟁력을 갖기 위해서는 AI 지식이 필수적이라고 생각했다. 다만 더이상 자신의 분야에 대한 지식 혹은 AI 지식 만을 겸비하고 이에 안주하기에는 AI의 범용성 및 접근성이 너무 용이해졌다고 생각한다. 즉, 다른 도메인이나 연구 분야까지 관심을 갖고 탐구해야할 필요가 있다고 생각한다.[발표 후기]6월 5일, 오전 10시 40분 세션에 참가하여 "선호도 기반 강화학습에서 보상 모델의 과대확신을 해결하기 위한 이중 혼합 방법론"이란 주제로 학술 발표를 진행했다. 강화학습의 보상 함수 설계 문제 -> 선호도 기반 강화학습 소개 -> PBRL의 보상 모델의 과대 확신 문제 -> 제안 방법론(이중 혼합) -> 실험 및 결론의 흐름으로 발표를 진행했지만, 약 10분 내외의 발표 시간만이 주어졌었기에, 조금 더 구체적이고 이해하기 쉽게 발표하지 못한 것 같아 아쉬움이 남는다.발표를 마치고, 질의 응답으로 좌장이셨던 한국공대 박성호 교수님께 다음과 같은 질문들을 받았다.Q1. 소프트 레이블은 기존에 널리 사용되었던 방법론인데, 다른 소프트 레이블 방법론들과 비교해보셨나요?A1. 네, 여러 소프트 레이블 방법론이 존재하며, 여러 방법론들과 비교 및 제거 실험을 진행한 이력이 있습니다. 실험 결과, 선호도 정도 차이를 고려한 Mixup기반 소프트 레이블링이 효과적이었음을 확인하였습니다.Q2. 과대확신 상황에 추가적으로 노이즈 레이블 상황까지 다룬건가요? 아니면 노이즈 상황이 메인 상황인건가요?A2.  충분히 혼동이 있을 수 있다고 생각합니다. 제가 주로 타겟한 상황은, 과대확신이 존재하는 "정상" 상황입니다. 추가적으로 노이즈 상황까지 다룬 것인데, PBRL에서는 인간 피드백 과정 중, 필연적으로 노이즈 레이블이 존재할 수 밖에 없습니다. 또한 모든 딥러닝 상황에서는 clean/noisy label이 주어지는 것 자체가 불확실하기 때문에, 두 상황에서 강건한 성능을 보장하는 것이 제 방법론의 기여도 중 하나입니다.또한 해당 세션의 모든 발표자가 발표를 마치고, 좌장이셨던 박성호 교수님께 피드백을 요청드렸다. 교수님께서는 논문을 라이팅할 때, 조금 더 강화학습 부분을 강조하고 참고하여 사용한 컴포넌트들이 필요할 수 밖에 없는 문제 상황과 근거 및 가설을 빌드업하는게 중요할 것 같다고 답변을 주셨다.[청취 후기]"T-VAD: Temporal-Aware Reinforcement Learning for Video Anomaly Detection" (포스터)폭력이나 절도 등의 이상 비디오가 주어지면, VLM을 통해 이상 비디오인지를 판단하는 연구였다. 타 연구와의 차별점은, 1에폭의 SFT-warmup 후, GRPO로 사후 학습을 진행하여 보다 정교하고 보지 못한 데이터셋에 일반적인 이상 탐지 성능을 확보하도록 설계하였다. 또한 GRPO의 상대적 이점 보상 함수 이외에 추가 보상 함수 항을 추가하였는데, 동일한 비디오에 대해 정상 시퀀스의 프레임과 셔플 시퀀스 간의 대조 학습을 진행하였다. 이를 목격하고 들은 생각은, 비디오 내 이상 상황은 이전과 이후 프레임 간 시간적 맥락이 중요할 것이고, 그 시퀀스가 무너지는 것을 모달로 사용하다면 어떤 의미가 존재하는가? 였다. 또한 GRPO는 보상 함수를 RULE-based 혹은 검증 가능한 보상 함수를 사용한다. 이는 이전 시간적 맥락을 고려하지 않고 단순히 SFT 참조 모델이 동일 입력에 대해 여러 생성한 답변을 상대적으로 비교하는 것인데, 구체적인 추론 과정과 피드백 학습이 어떻게 이루어지는지 궁금했다. 또한 GRPO의 보상 함수를 어떻게 설계했냐가 궁금해졌는데,  특히 마르코프 성질을 만족시키며 설계한 의도인지 궁금했다. 다만 아쉬운 점은 발표자가 부재했기에 궁금했던 점들을 물어볼 수 없었다는 점이다.
Reviewed by 정재우 정재우
2026.06.08
Read More
08
2026.06

2026 대한산업공학회 춘계학술대회 - 강동훈

[학회후기]2026년 6월 4일부터 5일까지 경주 화백컨벤션센터에서 열린 2026 대한산업공학회 춘계학술대회에 참가하였다. 이번 학회는 내가 처음으로 참여한 학회였기 때문에 긴장도 되었지만, 동시에 다양한 연구자들의 발표를 직접 들을 수 있다는 점에서 기대도 컸다. 실제로 구두 발표와 포스터 발표를 들으며 산업공학 분야에서 인공지능 방법론이 어떻게 활용되고 있는지 폭넓게 접할 수 있었다.특히 LLM, VLM, AI 에이전트 등 최근 주목받는 기술들이 여러 산업 문제에 적용되는 흐름을 확인할 수 있어 흥미로웠다. 또한 다른 연구자들이 문제를 어떻게 정의하고, 실험을 어떻게 설계하며, 발표를 어떻게 구성하는지 보면서 배울 점이 많았다. 처음 참여한 학회였던 만큼, 연구가 단순히 결과를 내는 것에서 끝나는 것이 아니라 그 필요성과 의미를 설득력 있게 전달하는 과정이라는 점을 새롭게 느낄 수 있었다.이번 학회는 내가 하고 있는 연구를 더 넓은 흐름 속에서 바라볼 수 있는 좋은 기회였다. 앞으로는 연구 결과뿐만 아니라 왜 이 문제가 중요한지, 어떤 관점에서 접근해야 하는지를 더 깊이 고민하며 연구를 진행해야겠다고 느꼈다.[발표 후기]이번 발표에서는 “약지도 비디오 이상 탐지를 위한 LoCAT: 국소 문맥 기반 텍스트 정제 기법”이라는 주제로 연구를 소개하였다. 본 연구는 비디오 전체의 정상/이상 여부만 주어진 약지도 비디오 이상 탐지 환경에서, 프레임 단위의 이상 징후를 더 정확히 탐지하는 것을 목표로 하였다. 기존 VadCLIP 기반 방법은 CLIP의 시각-언어 지식을 활용하지만, coarse-grained 탐지에서는 visual feature만을 사용하고, fine-grained 탐지에서는 모든 프레임이 동일한 class text feature를 공유한다는 한계가 있었다.이를 해결하기 위해 본 연구에서는 두 가지 방법을 제안하였다. 먼저 Dual-head Coarse를 통해 visual feature에 text 기반 의미 정보를 반영하여 anomaly score를 보정하고자 하였다. 또한 LoCAT을 통해 각 프레임 주변의 local context를 기반으로 class text feature를 프레임별로 정제하여, 시간에 따라 변화하는 이상 상황의 문맥을 더 잘 반영하고자 하였다. 실험 결과, UCF-Crime과 XD-Violence 데이터셋에서 coarse-grained 성능과 fine-grained 성능이 모두 기존 방법 대비 향상됨을 확인할 수 있었다.처음으로 학회에서 발표를 하다 보니 준비 과정에서는 긴장도 많이 되었지만, 연구의 문제 상황과 제안 방법을 다른 사람들에게 설명하는 과정을 통해 내가 수행한 연구를 다시 정리해볼 수 있었다. 특히 발표를 준비하면서 단순히 성능 향상을 보여주는 것뿐만 아니라, 기존 방법의 한계가 무엇이고 왜 제안 방법이 필요한지를 명확하게 전달하는 것이 중요하다는 점을 느꼈다. 이번 발표 경험은 앞으로 연구를 더 설득력 있게 구성하고 전달하는 데 좋은 계기가 되었다.질문 1: Coarse의 성능이 실제 산업에서는 더 중요할 수 있을 거 같은데 Coarse-grained 쪽의 성능만을 위한 테크닉을 사용하는 방법은 생각해봤는가?답변 1: 단순 이상/정상의 구분인 Coarse도 중요하지만 이상 현상의 시작과 끝 시점을 알아내는 Fine 역시 실제 산업군에서 중요할 수 있다고 생각하고 후속 연구들 역시 Coarse와 Fine 성능의 동시 개선을 목표로 하고 있다. Coarse의 성능 개선만을 위한 방법도 생각해보았지만 모델의 네트워크 구조상 Coarse와 Fine의 동시 성능 개선을 위하여 지금의 방법을 채택하였다. 질문 2: Coarse 성능 폭이 크지 않은거 같은데 해당 수치가 유의미한 수치라고 보는가?답변 2: 현재 baseline으로 삼은 VadCLIP 이후의 연구들에서 역시 Coarse 수치는 1% 정도의 수치 향상으로도 유의미하다고 설명을 하며 Fine과 Coarse의 성능을 다른 두 데이터셋에서 동시에 개선했다는 점에서 유의미하다고 생각한다.[청취 후기]1. 비디오 이상 탐지를 위한 자기지도학습 기반 멀티태스크 프레임워크 (부디조노 제이슨 레이넬 / 단국대학교)해당 연구는 정상 비디오 데이터만을 활용하여 이상 상황을 탐지하기 위한 자기지도학습 기반 멀티태스크 프레임워크를 제안한 연구였다. 기존의 단일 자기지도학습 방법은 프록시 태스크나 재구성 등 정상성의 일부 측면에만 집중한다는 한계가 있는데, 이 연구에서는 시공간 프록시 학습, CVAE 기반 중간 프레임 복원, 그리고 DKD 기반 지식 증류를 함께 활용하여 정상 패턴을 더 포괄적으로 학습하고자 했다. 내가 발표한 연구 역시 비디오 이상 탐지를 다루고 있었기 때문에, 정상 패턴을 어떤 방식으로 학습하고 이상 점수로 연결하는지가 특히 흥미로웠다. 여러 학습 목표를 결합하여 비디오의 공간적 정보, 시간적 흐름, 객체 중심 의미 정보를 함께 반영하려는 접근이 인상적이었다.2. 도메인 일반화를 위한 물리 정보 기반 베이지안 DeepONet: 수문 운영 변화에 따른 기수역 염분 예측 (유창연 / 한국공학대학교)해당 연구는 수문 운영 정책 변화로 인해 발생하는 domain shift 상황에서 기수역의 염분을 안정적으로 예측하기 위한 방법론을 제안한 연구였다. 특히 물리 법칙은 domain shift가 발생하더라도 유지된다는 점에 착안하여, 염분 수지 방정식을 물리 제약으로 활용하고 Bayesian DeepONet을 통해 예측 불확실성까지 함께 고려한 점이 흥미로웠다. 내가 주로 접하던 비전이나 영상 기반 연구와는 다른 도메인의 연구였지만, 실제 환경에서 발생하는 분포 변화 문제를 모델이 어떻게 견딜 수 있도록 설계하는지가 인상 깊었다. 
Reviewed by 강동훈 강동훈
2026.06.08
Read More