고려대학교 DMQA 연구실

2017 INFORMS Conference - 이상민

2017년 10월 30일 오후 4:24
조회수: 1181

Reviewed by

이상민

■ Background

2017년 INFORMS Annual Meeting은 미국 휴스턴에서 10/22 - 25 일정으로 개최되었다. 한달전 허리케인 '하비'의 여파로 휴스턴에 기록적인 폭우와 함께 수마가 휩쓸고 간터라 최악의 수해피해 상황으로 치닫지 않을까 걱정했지만 학회기간내 downtown의 피해 흔적을 찾아볼 수 없었다. (오히려 휴스턴 애스트로스의 월드시리즈 진출로 늦은밤까지 도시는 축제 분위기처럼 보였다.) 학회가 개최된 Geourge R. Brown Convention Center는 5,500 여명의 참가자와 백여개의 동시 진행 세션을 수용하기에 충분한 규모를 자랑했으며 휴스턴 도심 중앙에 위치하여 교통 접근성도 좋았다. 학회일정 동안 보고, 듣고, 느낀 점을 아래와 같이 공유하고자 한다.

■ Session Review

1. 데이터 애널리틱스 기반 우버 서비스

학회기간 중 가장 인상깊게 경청한 Plenary talk로 그 주제는 'Uber Service How Analytics Powers the Uber Marketplace' 였고, Uber technologies의 데이터분석 책임자인 Robert Phillips가 직접 강연하였다. 우버택시는 대표적인 공유경제 기반 서비스로써, 택시 이용자와 서비스제공자(운전자) 모두를 만족시키는 것이 중요하다. Robert는 이를 위해서 데이터 애널리틱스 방법이 우버 비즈니스에 얼마나 중요한 영감을 전달하고 예측기반의 가치있는 서비스들을 제공하고 있는지를 소개하였다. 우버 서비스의 대표적인 전략으로 운전자에 대한 incentive planning, 이용자를 위한 dynamic planning(pricing), 그리고 이용자와 운전자의 matching service를 차례로 설명하였다. 이 중 가장 흥미로웠던 내용은 pool matching 서비스였다. 목적지가 유사한 이용자들의 합승서비스를 유도하거나 운전자와 이용자의 위치와 경로에 따라서 실시간으로 matching pair를 맞교환(swap/replace)하는 서비를 일컫는데, 현실문제에서는 다수 운전자와 이용자가 존재할 수 있으므로 실시간에 가깝게 최적으로 맞교환하는 문제를 푸는 것은 상당히 어려울 수 있다. 또한 동적인 교통상황을 반영하여 최적 의사결정을 판단하거나 맞교환의 모든 경우의 수를 판단하는 것은 불가능에 가깝기 때문에 실제 어느 정도까지 서비스를 반영하고 있는지 궁금했다. 데이터에 기반하여 현장문제를 이해하고 서비스의 핵심을 간결하고 비중있게 제공하고 있는 우버 서비스의 성공가치는 데이터분석 전공자들에게 지속적인 관심대상이 되리라 생각한다.

2. 메타휴리스틱 기법 응용연구

조합최적화의 현실문제를 풀기 위한 휴리스틱기법 응용연구도 다수 소개되었다. 메타휴리스틱 기법연구는 INFORMS에서 자주 소개되는 단골분야로 매해 흥미로운 응용연구들이 소개되고 있다. 특히 선박의 정박일정문제(Berth shceuduling problem)에 대한 genetic algorithm 기반 근사최적화 연구, 전기전선배열문제(Wires routing in a 3D environment)의 최적배치를 위한 A* algorithm 적용연구, paricle swarm optimization 기반 설비배치문제(facility location problem)를 흥미롭게 들었다. 이외 양자컴퓨팅(Quantum Computing)과 관련된 메타휴리스틱 혼합연구가 있어 잠시 소개하고자 한다. 양자컴퓨팅 기술은 방대한 용량과 초병렬적 처리가 가능한 기술로 기존에 경험치 못한 엄청난 성능의 컴퓨팅 파워를 보여줄 것으로 기대되고 있다. 아직까지는 HW적 기술 발전이 제한적이라 최근 과도기적 기술의 소개가 주를 이루고 있다. 이번 Informs에서는 GA 등의 메타휴리스틱 기법을 이용하여 D-wave(엄밀히는 양자컴퓨터는 아니고, quantum annealing을 이용하는 특수목적형 컴퓨터로 특정 종류의 최적화 문제에 특화된 하드웨어라고 한다)을 활용하는 연구내용이 소개되었다. 이외 Parallel metaheuristic 방법론과 관련된 튜토리얼 세션을 통해 병렬처리기법을 활용한 효율적인 알고리즘 처리의 연구기법에 대한 관심을 갖게 되었다.

3. 데이터마이닝 응용연구

데이터마이닝 연구에서는 주로 고차원의 다변량 센싱데이터에 대한 연구주제가 주를 이루었다. 예를 들어, 비행기의 다중센서 기반 risk 관리 연구, 고차원 time series 데이터의 small shift detection 연구, EEG dataset의 time series classification 연구 등이 소개되었다. 이외 개인 연구주제인 베이지안네트워크 기법을 활용한 응용연구 사례도 있었다. INFORMS 주요 연구대상인 헬스케어(healthcare)분야에서 폐암 환자의 개별상태를 고려한 개인화 치료를 제공하기 위한 베이지안네트워크 응용연구가 소개되었다. 베이지안네트워크은 주어진 데이터 내 변수간 확률적 관계성을 탐색하고 표현할 수 있다는 장점이 있으나, 이외 다변수예측(multi-output prediction)이 가능하다는 점도 장점이다. 발표자는 폐암치료에 필요한 다중평가척도를 예측할 수 있는 베이지안네트워크 모델을 구축하여 환자 별 맞춤형치료(방사선, 약물치료 등)를 제공하고 있음을 소개하였다. 세션 이후 발표자와 베이지안네트워크 모델의 학습과정에서 구조학습에 대한 현 방법론들의 robustness에 대한 한계점과 향후 연구방향 등을 함께 공감할 수 있어서 의미있는 시간이었다.

4. 시뮬레이션 연구

금년에 경청한 시뮬레이션 연구세션으로는 미국방부(Department of Defense, DoD)의 무기체계 평가를 위한 시뮬레이션 연구사례들을 들 수 있다. 미국방부에서 무기개발 회사로부터 인수 시 다양한 테스트를 수행하는데, 이 중 실제 성능평가(pilot test) 이전까지 비용을 최소화 하기 위하여 시뮬레이션 테스트베드를 통한 통계적 가설검정을 수행한다. 기본적으로 시뮬레이션 평가란 V&V(Verfication & Validation) 과정을 모두 포함하는데, 이 때 verification은 시뮬레이션 모델이 의도한대로 구축되었는지 기본요건을 확인하는 단계이고, validation은 실제 시스템을 잘 모사했는지를 평가하는 단계이다. 발표 세션은 이 중 verification 작업을 주로 논의하였는데, 특히 시스템의 평가지표들의 평균, 표준편차 등의 기초 통계량에 대해서 각 값에 대한 상대적 비율차를 Heat map으로 가시화 시킴으로써 쉽고 빠르게 비교할 수 있는 모델평가 방법을 소개하였다. 또한 Kolmogorov-Smirnov test와 같이 관측치가 적은 시뮬레이션 비교평가 시 사용하는 goodness of fit test 외에도 다양한 nonparametric tests를 소개해주었는데, 다음 시뮬레이션 결과 비교 시 함께 사용해볼 수 있을 것 같다.

■ Presentation

금년도 발표주제는 변동성이 큰 제조환경에서 동적인 설비선택문제(equipment dispatching problem)를 기계학습 기반으로 제어하는 방법론을 소개하였다. 정적인 환경에서는 결정론적(deterministic) 접근법에 기반한 최적화모델을 사용하는 것이 큰 의미있고 효과도 좋다. 하지만, 동적인 환경을 반영하기 위해서는 다른 접근법들이 필요하다. 본 연구는 머신러닝 기반으로 각 설비선택규칙에 적합한 환경패턴을 학습하고 적합한 상황에 따라서 학습모델을 동적으로 변경하는 방법론을 제안하였다. 시뮬레이션 실험 결과, 정적인 제조환경에서는 최적화에 근사한 결과를 보였고 동적인 제조환경에서는 비교대안 중 가장 좋은 성능을 보였다. 특히, 연구대상인 설비선택규칙에 있어서 데이터불균형문제가 존재하여 이상탐지(novelty detection) 알고리즘을 적용하여 좋은 효과를 보았다.

일반적으로 데이터마이닝 응용연구들은 예측(prediction)문제를 풀고자 모델링에 힘을 쏟고 예측 정확성을 높이는데 집중하고 있다. 하지만 현실문제에서는 예측을 잘하는 것만큼 예측결과를 반영한 제어(control)를 잘하는 것도 중요하다. 특히 제조현장에는 휴리스틱 기반의 다양한 제어규칙들이 존재하는데 단순 조건문에 기반한 로직인 경우가 상당수로써 제조환경의 변화를 전혀 반영하고 있지 못하다. 그러므로 이들 모두 제조환경의 변화를 인지(recognition)하고 예측(prediction)하며 예측결과에 따라 적응제어(adaptive control)되어야 할 필요성이 있다. 앞으로도 '예측기반의 강건한 적응제어'라는 테마로 보다 의미있는 연구를 수행할 수 있도록 노력하겠다.