- With 삼성전자
- 2024-11-11 ~ 2025-10-27
연구 배경
제조 기업에서는 센서 기반 AI를 가전 제품에 탑재하여 모니터링하고, 이를 기반으로 적절한 서비스를 제공하여 고객의 사용 만족도를 증대시키는 것이 중요하다. 이때 제공되는 서비스의 품질은 고객의 제품 사용 기간 및 탑재 환경이 다르더라도 강건하고 일관되게 유지되어야 하며, 이를 위해 아래 두 가지 연구 목표를 달성해야 한다:
1) 다양한 고객 제품 사용 환경을 대변할 수 있는 AI 모델 학습 방법 연구
2) 각 고객 별 제품 사용 환경 변화를 반영할 수 있는 on-device 모델 개발
이때, 본 프로젝트에서는 1) 스틱 청소기 데이터를 기반으로 다양한 고객 데이터를 대변하고 가전 제품 AI 모델의 일반화 성능을 높이는 연구를 수행함과 더불어, 2) 강건한 냉장고 고내 온도 예측을 위하여 연합학습 방법론 개발을 함께 수행하였다.
1. 스틱 청소기 데이터셋 기반 시계열 센서 데이터 증강 기법 연구
본 연구는 스틱형 청소기 제품의 센서 시계열 데이터를 활용하여 다양한 고객군의 데이터를 대변하기 위한 증강(augmentation) 기법을 개발하는 것을 목표로 하였다. 이를 위해 청소기의 동작 구간 별로 진동, 전류, 전압, 온도 등 다중 센서 정보를 수집하고 이를 시계열 데이터로 전처리하여 분석을 수행하였다. 이 과정에서 데이터 증강을 통해 다양한 사용 환경 및 동작 패턴을 모사함으로써 학습 데이터의 다양성과 모델의 일반화 성능을 동시에 확보하고자 하였다.
데이터 형태는 두 가지로 구분하여 비교 실험을 수행하였으며, 데이터의 고유한 시간 정보를 최대한 보존할 수 있는 원본 시계열 데이터와 시계열의 핵심 정보만을 압축하여 효율적 학습을 할 수 있는 통계량 기반 tabular 데이터가 그것이다. 시계열 데이터의 경우 RandAugment 기법을 적용하여 증강을 수행하였으며, tabular 데이터의 경우 CIFRUS 기법을 적용하여서 데이터 증강을 수행하였다.
실험 결과, 증강 기법을 적용하지 않은 케이스와 비교하였을 때 데이터 형태와 무관하게 모두 유의미하게 성능이 향상된 것을 확인할 수가 있었다. 더불어, 데이터 취득이 제한적인 상황 (5%)에서도 증강을 통해 데이터를 100% 확보한 상황에 가까운 성능을 달성함으로써 증강 기법에 대한 효과 검증을 완료하였다.
2. 냉장고 데이터셋 기반 연합학습 기법 연구
본 연구에서는 고내 온도 모델을 구축하기 위한 연합학습 기법을 개발하였으며, 제품 출시 이후 생성되는 냉장고 고객 데이터를 온도 예측 모델에 지속적으로 반영하여 예측 성능을 향상시키는 것을 연구 목표로 한다. 이때, 센서 노후화나 기기 고장 등 냉장고의 물리적 결함으로 인해 발생하는 이상 데이터를 가진 고객 (클라이언트)을 자동으로 탐지 및 식별하고, 이상 고객이 온도 예측 모델 업데이트에 미치는 영향을 제어하여 학습 안정성과 신뢰성을 확보할 수 있는 알고리즘을 개발하였다.
본 연구에서 제안한 알고리즘의 동작 방식은 다음과 같다. 먼저 서버에서 정상 데이터만을 이용해 이상 고객 탐지 모델 (오토 인코더)을 사전학습시켜, 센서 노후화나 물리적 결함과 같은 데이터 왜곡 패턴을 복원오차로 포착 가능하게끔 한다. 이후 고객 별로 복원오차 기반 이상 고객 점수를 스코어링 하며, 해당 점수를 기반으로 연합학습에 참여할 지에 대한 여부를 결정한다. 본 연구에서는 복원오차 하위 N percentile에 해당하는 고객은 이상 고객으로 정의하여 학습에서 제외하였으며, 정상 고객만을 FedAvg 방식으로 집계하여 연합학습을 수행하였다.
실험 결과, 이상 고객이 존재하는 연합학습 상황에서도 제안 알고리즘이 가장 우수한 성능을 도출하였으며, 기존에 제안되었던 타 이상 대응 알고리즘과 비교하여서도 가장 우수한 성능을 달성한 것을 확인하였다.
이와 더불어, 연합학습이 완료된 글로벌 모델에 대해서 추가적인 on-device 개인화 연합학습을 수행하여 추가적인 성능 개선을 도모하였다. 이는 고객 별로 상이한 냉장고 운용 환경을 고려하여, 보다 개별 사용자 환경에 맞추어 글로벌 모델을 최적화하기 위해 수행된 연구이다. 개인화 연합학습은 각 고객의 데이터로 20 epochs만큼 미세 조정을 수행하여 진행하였다. 이에 대한 실험 결과, 모든 출력 데이터에서 개인화 연합학습을 적용하였을 때 더 우수한 성능을 달성하였으며, 글로벌 모델만으로는 반영되지 않았던 고객 별 편차를 효과적으로 보정 가능함을 확인하였다. 따라서 시간 및 비용이 확보되는 상황에서는 개인화 연합학습까지 수행하여 보다 우수한 예측 성능을 달성 가능함을 제언하였다.