고려대학교 DMQA 연구실

2017 대한산업공학회 추계학술대회 - 이상민

2017년 11월 6일 오후 4:53
조회수: 2051

Reviewed by

이상민

■ Background

금년 대한산업공학회 추계학술대회는 대전 KAIST 캠퍼스에서 개최되었다. 오랜만에 찾아간 산업경영학동은 많은 신식 건물들로 에워싸여져 있어 조금은 답답한 느낌이 들었지만, 바로 옆 아름다운 오리연못과 수북히 쌓인 가을 낙엽의 정경은 진한 여운을 남기기에 충분했다.

이번 학술대회는 '4차 산업혁명과 산업공학'이라는 이름 하에 산업공학의 다양한 주제와 연구분야들이 소개되었다. 특히 데이터 애널리틱스와 관련된 세션이 많았다는 점을 특징으로 꼽을 수 있다. 학술대회 동안 보고, 듣고, 느낀 점을 아래와 같이 기술한다.

■ Session Review

1. 프로세스 마이닝과 관련된 연구발표가 몇 차례 있었다. 프로세스 마이닝은 시간정보를 포함한 작업 이벤트 로그를 기반으로 유의미한 패턴과 주 프로세스의 스키마를 탐색할 때 유용한 기법이다. 특히 조선업과 같이 숙련된 작업자에 대한 의존도가 높아 뚜렷한 주공정 프로세스가 정형화 되지 않은 경우 뛰어난 효과를 볼 수 있다. 이번 학회 기간에도 프로세스 마이닝을 기반으로 제조공정을 분석하고 rework이나 waiting time의 관련성을 해석한 사례연구가 소개되었다. 분석결과나 그에 따른 인과관계 해석 면에서 다소 무리가 있었지만, 지속적으로 연구의 깊이를 더한다면 프로세스 기반한 연구의 좋은 사례를 보여줄 수 있으리라 생각한다. 특히 job shop 방식의 복잡다단한 제조업에서 프로세스 마이닝을 잘 활용한다면 복잡한 패턴이나 특이한 프로세스 이벤트에 기반한 이상상황을 잘 탐지할 수 있는 이상탐지 알고리즘을 만들 수 있지 않을까 싶다. 특히 이벤트 발생의 순차성에 기반한 빈번한 패턴을 확률을 표시하기 때문에 불확실성에 대한 시뮬레이션 평가나 심각한 상황에 대처하기 위한 risk management 측면도 고려할 수 있을 것이다.

2. 강화학습 기반으로 자동화시스템을 운영최적화 하고자 하는 응용연구 소개가 있었다. 연구대상은 반도체 물류자동화시스템으로, 반도체 공장 내 생산 carrier를 자동 반송처리하는 HW, SW를 총칭한다. 본 연구는 물류자동화시스템의 차량 교통정체문제를 해결하기 위해 운반하는 차량의 경로를 자동변경하기 위하여 강화학습을 적용하는 모델을 소개하였다. 반송처리 상황은 MDP(Markov decision process) 기반으로 모델링 하였고 반송 출발지와 도착지의 모든 pair에 대한 q value function을 업데이트했다. 업데이트할 경로의 penalty값은 주요한 link에 최대한 단순히 모델링하여 업데이트 해야 할 부담을 최소화 했다. 전반적으로 경로설정과 관련된 문제에 대해서 강화학습을 어떻게 적용할지에 대한 prototype을 잘 보여주었다고 생각한다.

허나, 제안모델과 실험결과를 보았을 때 현장적용을 위해서는 고민해볼만한 부분들이 다수 있다. 첫째, 최적 경로설정에 있어서 라우팅 설정에 필요한 기본 distance cost 외 보다 다양한 측면의 제조현장 상황을 반영했으면 한다. Q value 추정(최적 경로)시 얼마나 다양한 상황들(context)를 고려할 것인지, 상황이 서로 연관이 있거나 배타적인 경우 각 상황에 해당하는 변수의 weight parameter는 어떻게 설정하고 어떻게 업데이트 할지는 생각보다 어렵다. 이를 위해서는 다양한 조합의 시뮬레이션 실험을 통해서 탐색이 필요할텐데 DOE를 적용하더라도 그리 손쉬운 작업은 아닐 것이다.

둘째, 소개한 연구실험의 결과로 보였던 것처럼 국지적 정체가 발생하는 경우 adaptive routing의 효과가 높을 수는 있다. 하지만, 장기적인 정체부분 면에서는 오히려 교통혼잡이 가중될 수 있다. 단기적으로 routing을 조절하는 경우 multi-commodity flow 측면에서 오히려 라인 상황을 좋지 않을 수 있다는 연구결과도 이미 존재하므로 도로교통과 관련된 연구문헌을 참고하는 것이 좋겠다. 가만히 두면 해결될 문제를, 샤워실의 바보(Fool in the shower room)처럼 예민하게 실시간으로 조절(control)하게 되면 traffic imbalance problem 등 다양한 부작용이 발생할 수 있기 때문이다. 이러한 문제는 비단 본 연구 뿐만 아니라 예측 기반의 제어를 목표로 하는 연구들에 시시하는 면이 크다. 두고두고 되짚어 보아야 할 문제임이 분명하다.

셋째, 단기정체 회피외에도 서서히 누적되는 장기 정체 부분도 고려할 필요성이 있겠다.

넷째, 반송요청 수요 변화가 발생 시에 따른 실험결과가 추가되면 좋을 것 같다. 정적인 반송요청 수요가 존재하는 상황이 아닌, 반송요청 수요의 변화의 불확실성이 존재하는 경우의 실험에서 periodic DP 모델과 online DP 모델이 어떠한 결과를 보일지 흥미롭다. 소개했던 실험결과와 유사하게 반송시간을 단축시키는 우수한 결과를 보인다면 강화학습 기법 적용의 의미가 더 클 것이다.

다섯째, 세션 장에서도 이미 질문이 나왔던 부분이지만, 제안모델과 기존모델의 비교실험 시 개선효과는 강화학습의 순수 효과라기 보다는 대안경로 설정을 위한 볼츠만 계수의 사용이 주요한 효과일 것으로 추측한다. 초단기적 국지성 정체에 분산효과에는 결국 공급(경로의 차량수용능력)과 수요(경로를 이용하려는 차량)의 수급을 조절하는 것이 핵심이므로, 무엇보다 multi commodity를 고려한 모델이 필요하다. load balancing 효과에 기대지 않는다면 강화학습 기반의 dynamic routing의 순수 효과는 무엇인지 의문이 든다.

여섯째, 해당 모델에 비해서 실제 물류시스템의 현장은 수십, 수백배 크다고 보면 될 것 같다. 주행경로의 전체 크기와 복잡도나 차량의 대수, 그리고 반영해야 할 상황 모두 문제의 복잡도를 더한다. 이미 언급한 바, online DP모델은 문제 크기 면에서 취약할 수 있어 현실적인 대안이 될 확률이 적다. 온라인 학습의 이점은 최대한 살리면서 scalability 문제를 해결할 수 있는 다른 방식의 approximation approach가 함께 고려되면 좋겠다.

■ Presentation

이번 학회에서 발표한 연구주제는 Bayesian network의 구조학습이었다. Bayesian network은 주어진 dataset 내 변수 간 확률적 관계성을 표현하는 그래픽 모델이다. Bayesian network의 학습과정은 크게 구조학습(structure learning)과 파라미터 학습(parameter estimation) 두 가지로 나누어질 수 있는데, 이 중 구조학습은 NP-hard problem으로 증명된 바 있다. 본 연구는, 구조학습 과정을 제한된 시간내 보다 효과적으로 수행할 수 있도록 병렬처리 기법을 소개하였으며, 또한 구조학습 시 주로 활용되는 simulated annealing(담금질 기법)의 한계점을 극복하기 위해 reannealing with randomized-initial structure 기법을 소개하였다. 제안기법의 성능을 보이기 위해서 최근까지(~2015) 소개된 담금질 기법 기반의 구조학습 기법들과의 비교실험 결과 해 탐색의 정확성과 함께 탐색시간을 줄이는 우수성을 보였다.

발표 이후, 세가지 질문을 받았다. 첫째, 제안하는 병렬처리 기법과 기존의 메타휴리스틱 기법의 일종인 PSO(particle swarm optimization)과의 차이점이 무엇인지 설명해달라는 질문이었다. 제안하는 병렬처리 기법은 해의 탐색 시 탐색을 수행하는 instance가 서로의 탐색에 영향을 주지 않는다. 반면 PSO는 매 탐색 시 반복적으로 각 particle이 이동해야 할 방향성에 영향을 준다. 서로의 탐색 방식이 장단이 있을 수 있으나, 특정 iteration 후 활용(exploitation)효과가 높은 simulated annealing에는 서로 독립적으로 탐색(exploration)능력을 향상시킬 필요가 있다. 특히, 구조 탐색에서의 효과 못지 않게 메모리 측면에서도 높은 효과를 볼 수 있을 것이라 본다.

두번째 질문은, 병렬처리 외 reannealing with randomized-initial structure 기법의 효과에 대한 질문이었다. 실제 simulated annealing 기법과 관련하여 임의로 재탐색을 수행하는 휴리스틱 기법을 소개한 논문이 있는데, local minima에 빠질 경우 쉽게 빠져 나오지 못하는 기존 simulated annealing 보다 효과가 좋음이 실험을 소개된 바 있다. 특히, 본 논문연구에서의 실험 결과 병렬처리를 제외한 reannealing 효과만으로도 기존 제안기법 대비 뚜렷한 효과가 있었음을 소개하였다.

마지막 질문은, 병렬처리를 하면 단일 탐색처리하는 것보다 computational cost가 더 높아지지 않느냐는 질문이었다. 대답으로는 실험을 진행하는 PC의 core수 대비해서 적절한 병렬 탐색처리를 위한 thread 수를 정해둔다면, 1개의 탐색 instance를 수행하는 시간과 k개의 탐색 instances를 수행하는 시간은 동일하다고 답변했다. 추가로 추후에는 core가 CPU 보다 훨씬 많은 GPU 기반의 메타 휴리스틱 연구가 진행되면 효율적인 탐색이 이뤄질 것 같다고 설명했다. (실제로 메타 휴리스틱 연구 중 GPU 기반의 병렬처리에 관한 분야도 활발히 연구중이다.)

Conference