본 과제 목표는 비침습형 센서 데이터 기반 혈중 지질(lipid) 예측모델 개발이다. 예측모델을 학습하기 위한 데이터로 비침습형 광학 센서인 2차원 PPG (photoplethysmogram) 센서를 기반으로 혈중 지질 농도를 설명할 수 있는 다양한 타입의 센서로부터 데이터를 수집한다. 또한, 광학인자와 혈중 지질 농도와의 관계가 피험자마다 서로 다른 점을 고려하기 위해 피험자별 개인 정보(성별, 체질량 지수 등)를 입력 데이터로 사용한다. 수집된 데이터를 예측모델에 효과적으로 적용하기 위해 데이터 전처리(preprocessing) 및 오토인코더(autoencoder) 학습을 수행하여 유용한 특질을 추출하고, 데이터 비선형성을 반영할 수 있는 예측모델인 gradient boosting machine (GBM)을 순차적으로 적용하여 지질을 예측한다. 전반적인 연구 프로세스는 다음 그림과 같다.

  수집된 PPG 센서데이터는 유의미한 구역만 입력데이터로 사용하기 위해 필터링을 진행하고 관측치별 데이터 격차를 최소화하기 위한 정규화(normalization)을 진행한다. 필터링은 사전에 정의된 영역에 위치하는 센서만 사용하며, 피험자별 정규화는 각 데이터에 L2 정규화를 수행한다 (센서 타입마다 정의된 영역은 다르다). 이후 고차원 데이터를 저차원으로 표현하기 위해 오토인코더 기반 표현 학습을 진행하였고, 이렇게 추출된 특징을 예측모델에 적용하였다.