고려대학교 DMQA 연구실

2023 대한산업공학회 추계학술대회 - 정용태

2023년 11월 6일 오후 8:33
조회수: 35739

Reviewed by

정용태

[학회 후기]

2023년 11월 3일 울산과학기술원(UNIST)에서 개최된 대한산업공학회 추계학술대회에 참가하였다. 기온이 많이 내려 추운 날씨를 걱정하였지만, 학회 당일 울산의 날씨는 포근함이 느껴지는 참 기분좋은 맑은 날씨였다. 좋은 날씨 덕분에 더욱 설레이고, 기대되는 하루의 시작이었다. 이번 학회는 열심히 준비한 석사논문경진대회의 결실을 맺는 학회라는 점에서 조금 더 긴장되고, 기대되는 느낌이었다. 차례를 기다리면서 석사논문경진대회 본선에 진출한 학생들의 발표를 청취하였다. 본선에 진출한 학생들은 발표시간이 부족할만큼 많은 것을 준비하고 연구한 모습을 보여주어 대단하다는 생각이 들었고, 좋은 자극을 많이 받을 수 있었다. 모든 발표가 끝이 나고 우수상을 수상하였다. 석사논문경진대회를 잘 끝맺었다는 시원함과 조금 더 나은 결과에 대한 아쉬움이 공존하는 순간이었다. 하지만, 준비 과정에 최선을 다했고 준비한 것을 모두 보여주었기에 후회는 없었다. 무엇보다 석사논문경진대회를 준비하는 과정에서 교수님과 선배님들의 진심 어린 조언과 도움으로 한층 더 성장하였기에 매우 뜻 깊은 시간이었다. 도움을 주신 교수님 및 모든 선배/동료 연구원분들께 고맙다는 말을 전합니다.

[발표 후기]

이번 대한산업공학회에서는 "피실험자 변동에 강건한 인간 활동 인식을 위한 협력학습 활용 도메인 일반화"를 주제로 발표를 진행하였다. 인간 활동 인식 분야는 센서로 수집된 데이터를 통하여 사용자의 활동을 인식하는 기술이다. 인간 활동 인식 센서 신호 데이터는 사용자의 다양한 특성에 따라 데이터 분포에 차이가 발생하는 특징이 있다. 이에 새로운 분포의 피실험자에 대한 예측 성능이 하락하는 문제가 있다. 분포 차이로 인한 성능 하락 문제는 전이학습과 도메인 적응을 통해 해결 가능하지만, 두 방법론 모두 새로운 분포의 피실험자의 데이터 수집이 필수적이다. 따라서 본 연구는 추가적인 데이터 수집 없이 새로운 분포의 피실험자에게 뛰어난 예측 성능을 보이는 도메인 일반화 모델을 제안하는 것이 목표이다. 본 연구에서는 각 피실험자 군을 도메인으로 정의하고, 도메인 별로 구축된 분류 모델의 협력학습을 통해서 일반화 성능을 향상시키고자 한다. 각 도메인의 데이터로 학습된 도메인 특화 분류기를 Expert Model, 각 도메인의 데이터로 학습되지 않은 나머지 분류기를 Non-expert Model로 정의한다. 이후 Non-expert Model 앙상블과 Expert Model의 예측 결과가 유사하도록 학습하여, Non-expert Model의 일반화 성능을 향상시킨다. 이를 통해 각 분류기는 높은 일반화 성능을 갖게 되며, 높은 일반화 성능의 분류기 앙상블을 통해 새로운 분포의 데이터에 더욱 높은 예측 성능을 기대할 수 있다. 실험 결과 본 연구의 제안 방법론은 기존의 다양한 도메인 일반화 모델보다 우수한 성능을 보임을 입증하였다. 본 연구는 사용자의 특성에 따라 변동하는 인간 활동 인식 센서 신호 데이터에 대해서 새로운 사용자에 대한 데이터 수집 없이 높은 성능을 보이는 도메인 일반화 모델을 제안한다. 해당 연구는 데이터 수집 및 레이블링 비용을 절감할 수 있다는 의의를 가지며, 제조 및 의료 산업 분야로 확장이 가능하다.

질문 1) 연구 확장 분야를 센서 신호 데이터를 사용하는 제조 및 의료 산업 분야로 결정한 이유가 뭔가요?

답변 1) 도메인 일반화 분야는 이미지 데이터를 활용한 연구에 비하여 센서 신호 데이터를 활용한 연구가 부족한 상황이다. 따라서 센서 신호 데이터를 사용한 연구 분야로 확장하는 것을 목적으로 결정하였다.

질문 2) 새로운 사용자에 대한 성능을 높이는 것은 머신러닝이 기본적으로 추구하는 목적인데, 도메인 일반화를 사용한 이유가 뭔가요?

답변 2) 기본적인 머신러닝을 기존 사용자의 데이터를 통한 ERM(Empirical Risk Minimization) 모델이라고 할 수 있을 것 같다. 하지만 그보다 높은 성능을 보이는 것이 도메인 일반화의 목표이기에 적용해보고자 하였다.

질문 3) 피실험자군은 어떤 기준을 통해서 결정하였는가?

답변 3) 특별한 기준 없이 순서에 따라 동일한 수의 피실험자를 하나의 군집으로 결정하였다.

[청취 후기]

데이터 분포 기반 multiplier를 활용한 클래스 불균형 분류 해결(박태민, 김희영 - KAIST 산업 및 시스템 공학과)

현실의 많은 데이터셋은 클래스 별로 샘플 수가 현저히 차이가 나며, 데이터를 레이블링 하는데에는 많은 시간과 비용이 요구된다. 따라서 현실적으로 '클래스 불균형 반지도 학습'은 중요한 문제이다. 해당 연구는 Multiplier for Representation Learning을 기본으로 진행되었다. 학습 단계에서 Feature에 양수의 multiplier를 곱하여 각 Feature를 더욱 흩어지게 만들고 이를 통해 분류경계선을 구성함으로써 테스트 단계에서의 분류를 잘하도록 하는 방식이었다. 하지만 해당 방식은 각 클래스에 따라서 적절한 multiplier를 줄 수 없다는 단점이 존재하였고, 제안방법론은 각 클래스의 데이터의 개수를 반영하여 문제를 해결하는 방법이었다. 각 Feature에 multiplier를 곱하는 방식으로 각 관측치를 희소하게 만들어 문제를 해결하는 방식이 신선했다.

Conference