[학회후기]
서울에서 개최된 International Conference on Industrial Engineering and Applications (ICIEA) 학회에 참석하였다. 비록 서울에서 개최되었지만, 국제학회는 처음으로 참석한 것이라 기대 반 걱정 반의 마음으로 준비를 하였다. 개인적으로, 지난 2024 추계 대한산업공학회 발표와 2024 추계 데이터마이닝 학회 포스터 발표 모두 연구실 내 여러 연구원들과 함께 했던 프로젝트를 기반으로 수행한 연구로 진행했었어서, 온전히 개인 연구로 발표를 한다는 사실에 논리적 검증에 대한 준비를 하려고 노력했다. 학회를 준비하며 들었던 생각은 지금까지 연구실 세미나와 연구미팅 등 다수를 상대로 준비해왔던 자료를 사소한 것이라도 꼼꼼히 준비했던 내 자신이 기특했고, 이 내용을 바탕으로 발표자료도 잘 구성할 수 있었다.

[발표후기]
Consistency-Driven Diffusion for Robust Tabular Data Synthesis

발표후기: 이번 발표에서는 정형 데이터를 Variational Autoencoder(VAE)를 통해 latent space로 변환한 뒤, 이를 기반으로 Diffusion Model을 적용하여 데이터를 생성하는 연구를 소개하였다. 정형 데이터의 복잡한 패턴을 효과적으로 포착하기 위해, Consistency Regularization 기법을 도입하여 latent vector와 복원된 데이터 모두에서 일관된 결과를 얻을 수 있도록 유도한 연구이다. 발표 준비 과정에서는, 청중이 인공지능 연구자에 한정되지 않고 데이터 생성(task 자체)이 낯선 사람들이 많을 수 있다는 점을 고려하여, 보다 직관적인 설명을 중심으로 장표를 구성하고자 노력하였다. 특히 발표 도입부에서는 "정형 데이터를 사용해본 적이 있는가?"라는 질문을 던지며 청중과 소통을 시도했지만, 예상과는 달리 청중 반응이 미흡하여 다소 당황스러운 순간이 있었다. 이를 통해 다수 앞에서의 즉각적인 참여를 유도하는 방식은 다소 리스크가 있을 수 있다는 점을 느꼈다. 발표를 돌아보았을 때, 가능한 한 intuitive하고 이해하기 쉽게 설명하려 한 점에 대해서는 스스로 만족감을 느낀다. 다만 이번 학회를 통해 가장 크게 얻은 교훈은, 발표 준비 시 학회의 성격과 내가 속한 세션의 주제를 충분히 고려해야 한다는 점이었다. 예를 들어, 이번 연구를 소개할 때 단순히 인공지능 방법론 관점에서 설명하기보다는, industrial한 실제 상황을 예시로 들어 "이런 문제를 해결하는 하나의 solution"으로 접근했다면 청중들이 더욱 쉽게 연구의 필요성과 의의를 이해했을 것이라는 아쉬움이 남는다. 앞으로는 산업공학회, 정보학회, 컴퓨터 비전 학회 등 다양한 학회 발표를 준비할 때, 각 학회의 본질과 청중의 기대를 정확히 파악하고 발표를 준비하는 태도를 갖추려 한다.

질문 1: Consistency Loss를 적용하는 과정에서 strong/weak noise를 적용할 때 noise 수준은 어떻게 설정했는가?
답변 1: 실험에서 약한 노이즈는 VAEnormal distribution에서 표준 편차를 0.1, 강한 노이즈는 0.5 로 설정하여 각각의 노이즈가 해당 분포를 따르도록 설정하였다. 해당 값들은 실험을 통해 학습 안정성과 성능을 고려하여 설정하였다.
질문 2: 해당 모델을 적용하기 위한 데이터에 조건이 있는가? 성능이 높이 나오는 것을 보아 제약이 있을 것처럼 보이는데 어떤 제약이 있는가?
답변 2: 본 연구는 일반화 가능성이 큰 모델을 만드는 것에 집중하였다. 다시 말해 데이터의 사이즈에 구애 받지 않으며 데이터의 task(분류/회귀)에도 관련 없이 일관되게 높은 성능을 가지도록 설계하였으므로 적용 가능한 데이터에 특별한 제한 조건은 없다.


[청취후기]

Self-supervised Pre-training with Spatiotemporal Embedding and Masking Strategy for Human Action Recognition


청취후기: HAR 데이터에 Self-supervised Pre-training 방법을 적용한 연구를 청취하였다. 기존의 행동 인식 모델들이 대규모 레이블링 데이터에 의존하는 한계를 지적하며, 이를 극복하기 위해 Spatiotemporal EmbeddingMasking 전략을 활용한 자가지도학습 방법을 제안하였다. 발표 내용은 기존 지도 학습과의 차이를 명확히 설명하면서 어떻게 sample efficiency를 높이고, labeling cost를 줄일 수 있는지를 구체적으로 보여줘 이해하기 쉬웠다. 또한 다양한 실험 전략에 따른 성능 변화를 비교 실험하여 보여주어 방법론 설명을 들으며 궁금했던 부분도 직접적으로 해소할 수 있었다. 청취자의 관점에서 간단하거나 직관적인 사실이더라도 근거와 함께 보여주는 것이 중요하다는 점을 느낄 수 있었다.