2016 INFORMS학회 - 이상민
- 2016년 11월 21일 오전 6:34
- 조회수: 1635
Reviewed by
이상민
이상민
■ Summary
INFORMS 2016 annual meeting이 지난 11월12~16일 일정으로 Nashville, TN에서 개최되었다. OR/MS 분야 최대의 컨퍼런스인 점을 가늠할 수 있을 정도로 방대한 연구분야에 대해 발표세션과 키노트 스피치가 구성되었다. 금년에 발표된 프로그램 구성을 되짚어볼 때 산업공학의 주된 연구흐름을 파악할 수 있는 좋은 기회였다. 특히, data anlytics 연구와 healthcare 응용연구 열의가 날로 높아짐을 느꼈다.
또 한편으로 학회의 연구 다양성 추구에 대한 안목도 키울 수 있었다. INFORMS annual meeting과 같은 대규모의 학회구성 시 고민할 문제로 '전문성', '창의성', '동질성', '다양성'을 들 수 있을 것 같다. 모든 세션에서 발표되는 내용은 각 분야의 전문성을 갖추어야 하고, 기존연구와의 차별적 contribution이 명확해야 한다. 학회 참석 시마다 무엇을 얻어갈 수 있을까 기대감에 부풀게 되는건 앞의 두 가지 요소에서부터 나온다. 이와 더불어 OR/MS 분야내 다양한 연구자들의 서로 공감 할 수 있는 동질성을 갖는 것 또한 학회의 존재 가치로써 중요한 요소이다.
하지만 무엇보다 연구의 다양성을 꾀하고 개별 관점들을 존중하는 협력자세 또한 중요한 일이다. 사회적 관심분야에 휩쓸려 여러 분야 전문성을 갖춘 연구자들의 다양성을 홰손하는 것은 무척 위험한 상황이 될 수 있기 때문이다. 최근 추세의 유사 연구분야만을 다루고 유행하는 방법론만을 따른다면 그 연구분야는 고립된 갈라파고스 연구현장이 될 수 있다. 단기적 연구성과나 연구추세에 매몰되지 않고 각 연구자가 자신의 관점을 꾸준히 십년, 이십년 연구할 수 있는 토대가 구성될 때 우리나라에서도 Geoffrey Hinton과 같은 연구자가 나올 수 있을거라 생각한다.
특히 이번 INFORMS 학회는 많은 연구자들의 공통 관심분야인 'data anlytics'나 'healthcare', 'Uncertainty'에 대해 고유의 연구 강점들을 선보인 아이디어 콘테스트장 같은 느낌을 받았다. 동일한 연구목적을 갖더라도 100명의 연구자가 100개의 색다른 연구성과를 선보이는 자리, INFORMS 2016은 그런 학회였다. 이와 더불어, 생산현장에 적용가능한 다양한 연구 아이디어를 획득한 것도 큰 성과였다.
■ Session Review
개인연구 중인 Interpretable machine learning 또는 domain expert elicitation method 분야의 세션이 있었단 점에서 고무적이었다. 연구방향과 그 의미에 대해 보다 확신을 얻을 수 있는 자리였던 것 같다. Neustrel업체에서는 holistic model을 통해 주어진 데이터에 제한하지 않고 latent variables까지 추론하여 인과분석 framework에 활용하는 방법을 소개하였다. 기존에 인과분석 시 주로 활용되온 요인분석이나 Bayesian network 방법들은 latent variables에 대한 존재여부를 무시하고, temporal latent statistical relations에 따른 overfitting 문제도 고려치 않는 문제가 있다. 만약, 제안하는 universal structural modeling을 통해 좀 더 다양한 해석이 가능하다면 연구적 성과 외 실용적 측면에서도 큰 의미가 있을 것 같다. 이외 연구에서도 연관분석(association rules)을 기반으로한 해석능력 개선 연구(lift measure 기반 association rule grouping algorithm)와 semisupervised learning 시 사전지식을 활용한 clustering, classification 기법에 대한 연구도 일부 소개되어 흥미로웠다.
우리 연구실에서도 일부 연구원들이 수행하는 optimization in machine learning 연구분야도 인상 깊었다. MIT의 Dmitris Bertsimas 교수의 발표세션 외에도 앙상블 기법 연구나 Semisupervised learning 기법연구 소개 세션에서도 너나할 것 없이 최적화 기반 formulation이 게속해서 소개되었다. model 최적화를 위한 parameter tuning 외에도 해 탐색 과정이 iterative mechanism을 갖는 경우 greedy search하는 알고리즘에 대해서도 적용효과가 높지 않을까 싶다. 해당 연구분야에도 관심을 갖게 되었다는 점이 이번 학회로부터 얻어온 의미가 크다.
정체(congestion on road network)문제도 몇일에 거친 세션들로 중요하게 다루어졌다. 정체현상은 도로자원의 대표적인 bottleneck 현상이나 해결하기 어렵기 때문에 다양한 분야에서 해를 찾고자 관심을 갖고 있다. 정체해소를 위해 정체의 temporal status를 인지하기 위한 정체 평가모델 구축이나 시뮬레이션연구 등이 소개되었으며, 이외 정성적&정량적 분석을 통합한 수식을 통해 대만 또는 홍콩 도시와 같은 상습 정체발생 도시에 대한 응용연구를 선보였다. 또한 교차로(intersection)를 기준으로 사고발생지까지의 거리정보를 측정하여, 교차로 기반 사고발생 예측모델을 구축하는 등의 응용연구도 다수 이루어졌다. 본 학회에서 내가 발표한 주제도 정체현상에 관련이 있었지만, 정체해소 방안들이 도로수요를 분산시키는 정책적인 측면이나 도로의 변형 또는 기타 다른 접근방식을 취했다는 점에서 상이하여 흥미로웠다.
이외 Mustafa 교수의 time series classification 연구도 흥미롭게 들었다. time series 분류문제는 데이터 양이 많고 고차원 데이터 분석 문제에 빠질 수 있으며, time warping 처리 등의 문제를 다루어야 하는 어려운 주제이다. 기존 DTW를 통해 일부 활용된 바 있으나 scalable하지 못한 점에서 다른 기법들이 제안되고 있다. mustafa 교수는 shapelets(time series subsequences, 일부 유사 패턴만을 추출하여 transform하는 일종의 feature extraction 기법)을 이용한 classification 성능을 선보여 나은 점을 선보였다. 발표후 shapelet-transform 시 해당 time series의 중요 shapelet의 순서도 보존되는지 질문드렸는데, 이와 관련해서 진행할 subtask가 더 남아 있는 듯 했다. 작년에는 autocorrelation 측면에서 시계열 데이터 분류연구를 발표하셨던 것으로 기억하는데, 시계열 데이터 분석에 초점을 맞춘 듯 하였다.
또한 언젠가는 한번 다루어보고 싶은 parallel computing 연구분야에 대한 소개도 일부 이루어졌다. 예를 들어 hierarchical clustering의 dissimilarity measure 측정의 시간 복잡도를 줄이기 위한 병렬처리 연구소개 등도 재미있는 소재가 된 듯 하다. 우리가 다루고 있는 많은 machine learning 알고리즘 중에서도 이와 같이 scalablity 개선을 위해 병렬처리가 가능한 알고리즘이 있을 것이다. 서로 독립적으로 연산부로 취급하여 데이터를 나누는(map()) 과정과 해당 결과를 합치는 과정(combine())으로 optimal solution 또는 near optimal solution을 취할 수 있는 모든 알고리즘이 그 대상이 될 것이다. 특히 최근에 기업형 분산형 framework으로 각광받고 있는 apache spark를 기반으로 한 연구(caching data 기반의 분산처리 알고리즘)는 보다 실용적 측면이 더해질 수 있을 것 같다. 사실 이런 연구분야는 CS에서 주로 접근하는 연구방식이긴 하지만, 필요성이 따른다면 다양한 기법측면의 collaboration은 우리 분야에서 주도할 수 있지 않을까 생각이 든다.
시뮬레이션 연구분야 소개와 관련 업체들의 부스에서는 새로운 trend나 keywords를 찾기보기는 힘들었다. 최근 몇년간 소개되고 있는 agent-based approach나 system dynamics 또는 visulaization power등이 게속 이어져 내려오는 듯 싶다. Anylogic과 같은 대표적인 시뮬레이터 솔루션 업체에서는 보다 여러 산업분야에 활용될 수 있음을 소개하기 위해 별도의 소규모 conference를 개최하였고, 솔루션에서는 모델링 작업을 보다 쉽게 가져가도록 더 많은 prototype model을 제공하는 점이 인상 깊었다.
■ Presentation
금년 수행했던 산학프로젝트의 연구적 성과물에 대해 소개하는 자리를 가졌다. 내 발표일정은 학회의 마지막 날, 마지막 세션에 포함되어 있었기에, 기대에 어긋나지 않을만큼의 세션 참가자들을 만날 수 있었다.
발표 후 Rutger대학의 Weihong Guo 교수으로부터 회귀모형 구성에 대한 질문을 받았다. CNC machine과 관련된 유사한 예측연구를 수행한 경험이 있어, OHT와 같이 운송체계에 대한 예측연구가 인상깊다고 얘기를 들었다. 교수님과는 작년 INFORMS에서 동료의 발표를 참관하다가 만나 뵌 적이 있었기에 좀 더 친숙하게 얘기 나눌 수 있었다.
이번 발표는 조금은 익숙해진 해외학회발표에 대해 막연한 두려움을 떨칠 수 있었으나, 좋은 영어발표를 위해 필요한 개선점들을 여럿 찾아볼 수 있는 의미있는 시간이었다. 어느 블로그에서 소개했던 '논문발표는 마케팅이다'라는 문구가 다시끔 머릿속을 맴돈다. 학회 논문발표는 내 연구내용을 자랑하려고 하는 자리도 아니고, 누군가의 성과를 이기기 위해 투쟁하는 자리는 더더욱 아니다. 석사, 박사 디펜스 하는 자리가 아닌만큼 청중의 질문도 보다 열린 마음으로 받아들일 수 있다. 논문발표의 목적식을 세우고자 한다면, 내 연구내용의 얼마나 많은 부분을 이해시켰는가가 필히 들어가야 할 것이다. 경청자들로 하여끔 내 연구의 중요성과 결과물을 한정된 시간 내 잘 전달하기 위해서는 철저한 연극의 준비가 필요하다. 이번 발표를 통해 내가 너무 많은 transitional words나 phrases 사용한 점이 발표몰입에 방해가 될 수 있음을 느낄 수 있었다. 아직은 부족한 면이 많으나 계속해서 발전하여 청중들에게 깊은 인상을 주는 발표자가 되겠다.
INFORMS 2016 annual meeting이 지난 11월12~16일 일정으로 Nashville, TN에서 개최되었다. OR/MS 분야 최대의 컨퍼런스인 점을 가늠할 수 있을 정도로 방대한 연구분야에 대해 발표세션과 키노트 스피치가 구성되었다. 금년에 발표된 프로그램 구성을 되짚어볼 때 산업공학의 주된 연구흐름을 파악할 수 있는 좋은 기회였다. 특히, data anlytics 연구와 healthcare 응용연구 열의가 날로 높아짐을 느꼈다.
또 한편으로 학회의 연구 다양성 추구에 대한 안목도 키울 수 있었다. INFORMS annual meeting과 같은 대규모의 학회구성 시 고민할 문제로 '전문성', '창의성', '동질성', '다양성'을 들 수 있을 것 같다. 모든 세션에서 발표되는 내용은 각 분야의 전문성을 갖추어야 하고, 기존연구와의 차별적 contribution이 명확해야 한다. 학회 참석 시마다 무엇을 얻어갈 수 있을까 기대감에 부풀게 되는건 앞의 두 가지 요소에서부터 나온다. 이와 더불어 OR/MS 분야내 다양한 연구자들의 서로 공감 할 수 있는 동질성을 갖는 것 또한 학회의 존재 가치로써 중요한 요소이다.
하지만 무엇보다 연구의 다양성을 꾀하고 개별 관점들을 존중하는 협력자세 또한 중요한 일이다. 사회적 관심분야에 휩쓸려 여러 분야 전문성을 갖춘 연구자들의 다양성을 홰손하는 것은 무척 위험한 상황이 될 수 있기 때문이다. 최근 추세의 유사 연구분야만을 다루고 유행하는 방법론만을 따른다면 그 연구분야는 고립된 갈라파고스 연구현장이 될 수 있다. 단기적 연구성과나 연구추세에 매몰되지 않고 각 연구자가 자신의 관점을 꾸준히 십년, 이십년 연구할 수 있는 토대가 구성될 때 우리나라에서도 Geoffrey Hinton과 같은 연구자가 나올 수 있을거라 생각한다.
특히 이번 INFORMS 학회는 많은 연구자들의 공통 관심분야인 'data anlytics'나 'healthcare', 'Uncertainty'에 대해 고유의 연구 강점들을 선보인 아이디어 콘테스트장 같은 느낌을 받았다. 동일한 연구목적을 갖더라도 100명의 연구자가 100개의 색다른 연구성과를 선보이는 자리, INFORMS 2016은 그런 학회였다. 이와 더불어, 생산현장에 적용가능한 다양한 연구 아이디어를 획득한 것도 큰 성과였다.
■ Session Review
개인연구 중인 Interpretable machine learning 또는 domain expert elicitation method 분야의 세션이 있었단 점에서 고무적이었다. 연구방향과 그 의미에 대해 보다 확신을 얻을 수 있는 자리였던 것 같다. Neustrel업체에서는 holistic model을 통해 주어진 데이터에 제한하지 않고 latent variables까지 추론하여 인과분석 framework에 활용하는 방법을 소개하였다. 기존에 인과분석 시 주로 활용되온 요인분석이나 Bayesian network 방법들은 latent variables에 대한 존재여부를 무시하고, temporal latent statistical relations에 따른 overfitting 문제도 고려치 않는 문제가 있다. 만약, 제안하는 universal structural modeling을 통해 좀 더 다양한 해석이 가능하다면 연구적 성과 외 실용적 측면에서도 큰 의미가 있을 것 같다. 이외 연구에서도 연관분석(association rules)을 기반으로한 해석능력 개선 연구(lift measure 기반 association rule grouping algorithm)와 semisupervised learning 시 사전지식을 활용한 clustering, classification 기법에 대한 연구도 일부 소개되어 흥미로웠다.
우리 연구실에서도 일부 연구원들이 수행하는 optimization in machine learning 연구분야도 인상 깊었다. MIT의 Dmitris Bertsimas 교수의 발표세션 외에도 앙상블 기법 연구나 Semisupervised learning 기법연구 소개 세션에서도 너나할 것 없이 최적화 기반 formulation이 게속해서 소개되었다. model 최적화를 위한 parameter tuning 외에도 해 탐색 과정이 iterative mechanism을 갖는 경우 greedy search하는 알고리즘에 대해서도 적용효과가 높지 않을까 싶다. 해당 연구분야에도 관심을 갖게 되었다는 점이 이번 학회로부터 얻어온 의미가 크다.
정체(congestion on road network)문제도 몇일에 거친 세션들로 중요하게 다루어졌다. 정체현상은 도로자원의 대표적인 bottleneck 현상이나 해결하기 어렵기 때문에 다양한 분야에서 해를 찾고자 관심을 갖고 있다. 정체해소를 위해 정체의 temporal status를 인지하기 위한 정체 평가모델 구축이나 시뮬레이션연구 등이 소개되었으며, 이외 정성적&정량적 분석을 통합한 수식을 통해 대만 또는 홍콩 도시와 같은 상습 정체발생 도시에 대한 응용연구를 선보였다. 또한 교차로(intersection)를 기준으로 사고발생지까지의 거리정보를 측정하여, 교차로 기반 사고발생 예측모델을 구축하는 등의 응용연구도 다수 이루어졌다. 본 학회에서 내가 발표한 주제도 정체현상에 관련이 있었지만, 정체해소 방안들이 도로수요를 분산시키는 정책적인 측면이나 도로의 변형 또는 기타 다른 접근방식을 취했다는 점에서 상이하여 흥미로웠다.
이외 Mustafa 교수의 time series classification 연구도 흥미롭게 들었다. time series 분류문제는 데이터 양이 많고 고차원 데이터 분석 문제에 빠질 수 있으며, time warping 처리 등의 문제를 다루어야 하는 어려운 주제이다. 기존 DTW를 통해 일부 활용된 바 있으나 scalable하지 못한 점에서 다른 기법들이 제안되고 있다. mustafa 교수는 shapelets(time series subsequences, 일부 유사 패턴만을 추출하여 transform하는 일종의 feature extraction 기법)을 이용한 classification 성능을 선보여 나은 점을 선보였다. 발표후 shapelet-transform 시 해당 time series의 중요 shapelet의 순서도 보존되는지 질문드렸는데, 이와 관련해서 진행할 subtask가 더 남아 있는 듯 했다. 작년에는 autocorrelation 측면에서 시계열 데이터 분류연구를 발표하셨던 것으로 기억하는데, 시계열 데이터 분석에 초점을 맞춘 듯 하였다.
또한 언젠가는 한번 다루어보고 싶은 parallel computing 연구분야에 대한 소개도 일부 이루어졌다. 예를 들어 hierarchical clustering의 dissimilarity measure 측정의 시간 복잡도를 줄이기 위한 병렬처리 연구소개 등도 재미있는 소재가 된 듯 하다. 우리가 다루고 있는 많은 machine learning 알고리즘 중에서도 이와 같이 scalablity 개선을 위해 병렬처리가 가능한 알고리즘이 있을 것이다. 서로 독립적으로 연산부로 취급하여 데이터를 나누는(map()) 과정과 해당 결과를 합치는 과정(combine())으로 optimal solution 또는 near optimal solution을 취할 수 있는 모든 알고리즘이 그 대상이 될 것이다. 특히 최근에 기업형 분산형 framework으로 각광받고 있는 apache spark를 기반으로 한 연구(caching data 기반의 분산처리 알고리즘)는 보다 실용적 측면이 더해질 수 있을 것 같다. 사실 이런 연구분야는 CS에서 주로 접근하는 연구방식이긴 하지만, 필요성이 따른다면 다양한 기법측면의 collaboration은 우리 분야에서 주도할 수 있지 않을까 생각이 든다.
시뮬레이션 연구분야 소개와 관련 업체들의 부스에서는 새로운 trend나 keywords를 찾기보기는 힘들었다. 최근 몇년간 소개되고 있는 agent-based approach나 system dynamics 또는 visulaization power등이 게속 이어져 내려오는 듯 싶다. Anylogic과 같은 대표적인 시뮬레이터 솔루션 업체에서는 보다 여러 산업분야에 활용될 수 있음을 소개하기 위해 별도의 소규모 conference를 개최하였고, 솔루션에서는 모델링 작업을 보다 쉽게 가져가도록 더 많은 prototype model을 제공하는 점이 인상 깊었다.
■ Presentation
금년 수행했던 산학프로젝트의 연구적 성과물에 대해 소개하는 자리를 가졌다. 내 발표일정은 학회의 마지막 날, 마지막 세션에 포함되어 있었기에, 기대에 어긋나지 않을만큼의 세션 참가자들을 만날 수 있었다.
발표 후 Rutger대학의 Weihong Guo 교수으로부터 회귀모형 구성에 대한 질문을 받았다. CNC machine과 관련된 유사한 예측연구를 수행한 경험이 있어, OHT와 같이 운송체계에 대한 예측연구가 인상깊다고 얘기를 들었다. 교수님과는 작년 INFORMS에서 동료의 발표를 참관하다가 만나 뵌 적이 있었기에 좀 더 친숙하게 얘기 나눌 수 있었다.
이번 발표는 조금은 익숙해진 해외학회발표에 대해 막연한 두려움을 떨칠 수 있었으나, 좋은 영어발표를 위해 필요한 개선점들을 여럿 찾아볼 수 있는 의미있는 시간이었다. 어느 블로그에서 소개했던 '논문발표는 마케팅이다'라는 문구가 다시끔 머릿속을 맴돈다. 학회 논문발표는 내 연구내용을 자랑하려고 하는 자리도 아니고, 누군가의 성과를 이기기 위해 투쟁하는 자리는 더더욱 아니다. 석사, 박사 디펜스 하는 자리가 아닌만큼 청중의 질문도 보다 열린 마음으로 받아들일 수 있다. 논문발표의 목적식을 세우고자 한다면, 내 연구내용의 얼마나 많은 부분을 이해시켰는가가 필히 들어가야 할 것이다. 경청자들로 하여끔 내 연구의 중요성과 결과물을 한정된 시간 내 잘 전달하기 위해서는 철저한 연극의 준비가 필요하다. 이번 발표를 통해 내가 너무 많은 transitional words나 phrases 사용한 점이 발표몰입에 방해가 될 수 있음을 느낄 수 있었다. 아직은 부족한 면이 많으나 계속해서 발전하여 청중들에게 깊은 인상을 주는 발표자가 되겠다.