[학회 후기]

2024 춘계 한국데이터마이닝학회에 연구실 인원들과 한께 다녀왔다. 데이터마이닝 학회는 작년 추계 이후 두번째 방문이었는데, 지난 번과 비교하여 생각해보았을 때 조금 더 세분화 된 세션으로 구분되어 있어 청취자의 입장에서 원하는 발표를 골라 듣기 용이했다. 특히, 이미지 처리, 자연어 처리처럼 큰 갈래가 아닌 헬스 케어 분석 및 경영 과학 분야까지 나누어져 있어 여러 분야의 최신 연구 동향을 확인할 수 있었다.  연구를 시작함에 있어 어떤 방향으로 나아가야 할 지를 비롯하여 최근 고민하고 있던 평가 방법까지 다양한 연구원 분들의 고민을 고스란히 전달 받아 이것이 아이디어로 이어질 수 있던 좋은 기회가 될 수 있었다.


[청취 후기] 

1. TA-Net : Tri-Aspect Network for Camouflaged Object Detection

해당 연구는 Camouflaged 된 물체를 식별하기 위한 방법론을 제시한 연구로써, 경계, 색상, 질감 세 가지의 시각적 특성에 특화된 네트워크를 사용하였다. 특히 Erosion kernel, edge network, RGB to HSV 변환 처리를 통해 방법론을 고도화 한 부분이 인상적이었는데, 많은 실험적인 시행착오가 있었을 것으로 예상할 수 있는 만큼 더욱 대단하게 느껴졌다.


2. 포즈 인식 디퓨전 모델을 통한 가상 의상 착용

해당 연구는 디퓨전 모델을 활용하여 가상 의상 착용 방법론을 제안하였다. 연구실 내 박태남 연구원의 발표였던만큼 더욱 주의를 기울여 들었는데 과거에 흥미를 가지고 실험을 진행했던 기억이 있는 ControlNet의 방법론을 일부 도입한 연구로 포즈 맵을 더하여 다양한 각도와 자세를 반영한 가상 의상 착용 이미지를 생성한 것이 흥미로웠다. 작년에 연구 결과를 공유했을 때와 비교하여 더욱 정교하고 사실적인 이미지가 생성되었다는 사실에 놀랐고, 그 과정에서 많은 노력이 들어갔다는 것을 잘  알기에 더욱 많은 귀감을 준 발표였다.


3. WHY-Chain: Learning Language by Repeated "Why?" Questions as Children Do

학회장에 도착하여 발표 논문들을 보았을 때 가장 호기심을 자극했던 연구였다. 교수님을 포함한 여러 선배 연구원들께서 논문의 제목을 잘 짓는 것도 중요한 포인트라고 하셨던 말들이 떠올랐다. 흔히 아이를 키우다 보면 아이들이 세상의 모든 것에 대해 '왜?'라고 물어보는 시기가 있다고 전해 들었다. 해당 연구는 이러한 어린 아이들의 질문을 motivation 삼아 LLM에 특정 문장에 대해 계속해서 WHY? 쿼리를 입력하여 나온 답변들로 상식 추론 데이터셋을 만들고 이를 다시 T5에 학습 시켜 Commonsence Reasoning의 성능을 확인하였다. 현재 수강하고 있는 학교 수업에서 LLM 관련 프로젝트를 진행하고 있는데, LLM은 프레임워크를 다루고 그것을 기반으로 '어떻게' 모델을 설계하고 나의 방법론을 '검증' 할 것인지가 가장 어려운 부분이라고 생각한다. 연구원분들의 고민의 흐름과 그를 해결하기 위해 접근한 방법들을 나의 프로젝트에도 적용하고 싶다는 생각을 할 수 있었다.