학회명


 기  간

 장  소 

 

 Informs 2015 annual meeting 

 (The Institute for operations Research and the Management Sciences)

 2015. 11. 1 ~ 4 

 Philadelphia, USA



1. 참석 소감

 이번 후기는 "INFORMS를 드디어 다녀왔다" 라는 표현으로 시작하는 것이 좋을 것 같다. '15년 3월 교수님과 동료들과의 첫 식사 자리에서 가장 큰 규모의 학회가 열린다는 막연한 기대감에 그 곳에서 발표를 목표해보겠다는 이야기를 나눈적이 있었는데, 석사 입학 후 8개월 동안 자리잡았던 가장 무거웠던 목표를 실현하는 장소였기에 개인적으로는 오랫동안 회상할 수 있는 장소가 추가된 느낌이었다. 앞의 상민이나 완식, 진수의 후기처럼 압도적인 학회의 규모 뿐 아니라 발표의 내용에서도 매우 만족스러운 학회였으며, 굳이 학회의 느낀 점을 한 단어로 요약한다면 "거대한 공유"라고 표현하고 싶다. 발표를 하고, 세미나를 듣고 그 후에 이야기를 나누는 자유로운 모습 속에서 단순히 지식을 공유한다기 보다는 같은 학문을 고민하는 동반자로써 그들의 열정을 공유하고 공동의 목표를 공유하는 자리로 느껴졌기 때문이다. 집단 이성이되 전문가들로만 구성된 거대한 집단의 힘을 느낄 수 있는 자리였으며, 이러한 모임이 오늘날 빅데이터와 같은 새로운 트렌드를 만들고 사회의 방향을 결정짓은 것은 아닐까 생각이 들기도 하였다. 

 기업 부스에서는 최적화 및 시뮬레이션 회사들이 주류를 이루었는데 최근 두각을 보이는 Simio와 AnyLogic의 부스를 경험할 수 있어서 유익하였다. 세트 산업의 경우는 부품 산업과는 다르게 라인의 변화가 빠르기 때문에 모델의 정확성도 중요하지만, 모델 구축의 용이성이 어떤 면에서는 더욱 중요할 수 있는데 기존의 객체 기반의 시뮬레이터인 Automode는 정확은 하지만 모델 구축을 위한 소요시간이 너무 길기 때문에 제한적으로 사용하거나, 일부에서는 자체 개발을 시도하고 있기까지 한데 새로운 시뮬레이션 툴에 대한 교육 교재를 무료로 받을 수 있어서 유익하였고 향후 검증을 거쳐 실무에 활용까지도 고려해 볼 수 있을듯 하다.


2. 개인 발표 : 제목 "Multivariate Monitoring of the metal frame process"

 발표 모습을 개인적으로 평가하자면 무난했다라는 표현이 알맞을 것이라 생각한다. 자유롭게 영어를 구사할 수 있는 실력은 아니므로 무리없고 익숙한 표현들로 발표 스크립트를 구성하여 진행하였는데 우선 큰 실수가 없었다는 점에서 만족한다. 하지만 완급의 조절이나 적절한 연결어구의 사용 등에서는 아쉬운 점들도 있었는데 첫 술에 배부를 수 없듯이 다음 학회에서는 좀 더 수준있는 내용을 원활하게 발표할 수 있도록 지금부터 꾸준히 준비해야겠다는 생각이 들었다.

 또한 개제 전의 논문의 내용을 요약하여 발표하는 자리였기 때문에 외부의 시각으로 연구 내용을 검증 받을 수 있는 시간이라는 생각이 있었는데, 역시 여러 질문을 통해 앞으로의 연구 방향을 생각해 볼 수 있는 좋은 모티브를 얻기도 하였다. 질문 내용은 아래와 같다.

 

Q1. 데이터셋이 정규형을 따르지 않기 때문에 비모수 기반의 2-sample-difference test 이나 bootstrapping을 사용한 것으로 보이는데 통계량은 정규분포의 가정이 필요한 T^2를 사용한 이유가 있는가?

A. T^2 통계량은 변수간의 상관관계를 반영할 수 있는 모니터링 통계량이며 실험 데이터셋 또한 변수간의 상관관계가 높았기 때문에 이를 반영하기 위해 사용을 하였다. 다만 기존의 방법대로 한다면 관리한계 설정이나 decomposition시 정규성 가정하에 F-분포나 X^2 분포를 사용하게 되어 오류가 발생하는데 이를 bootstrapping이나 Rank sum을 사용하여 보완하고자 하였다. 

Q. T^2 외 비모수 접근 방법으로 SVMDD와 같은 One class classification 방법이 더욱 성능이 좋을 수도 있을 것이다. 

A. 시간관계상 생략하였으나 향후 연구주제에 반영하여 실험을 진행하고 있다. 조언에 감사드린다. 

 

 나의 발표에서 나온 질문은 아니었으나 상민이의 발표 후 질문을 통해 새롭게 안 사실은 decomposition의 기법이 상관 관계가 높은 데이터 셋에서 마치 회귀분석의 계수가 샘플에 따라 크게 변화는 것과 같이 Unstable 한 경향이 있다는 점을 지적하였는데 학회 참석을 통해 처음 알게되어 이 부분의 문제점도 향후의 연구 과제로 고민해 볼 예정이다.

 

3. 청취 내용

 이번 학회를 통해 얻은 가장 큰 소득은 최적화에 대한 새로운 시각이다. 기존의 경험한 연구들은 어떤 알고리즘이나 모델을 개발한 뒤에는 이를 실험적으로 증명하는 모습을 많이 봐왔으며, 특히 최적의 파라미터를 도출하기 위해 매우 촘촘한 간격으로 증가하거나 감소시키면서 결과를 종합해야 하기 때문에 파라미터가 많은 경우에는 굉장한 시간을 요하는 방법임이 분영하다. 하지만 이번 세미나에서는 목적식을 라그랑지안 문제로 계산하여 최소값을 도출하는 접근이 굉장히 많았다. 이러한 방법론은 첫 날의 Keynote였던 Stephen. Wright 교수의 Optimization Techniques in Data Analysis에서도 확인할 수 있었다. Robust한 모델을 얻기 위해 우리에게 잘 알려진 Ridge나 Lasso의 접근 방법을 모델의 Variance를 최소화 하는 최적화의 관점에서 설명하였고, 이를 Deep leaning의 모델에도 확장하여 파라미터를 설명하는 모습이 인상적이었으며 이러한 연구가 최적화 부분의 최근 주류임을 알 수 있었다.

 진행중인 연구 주제가 공정의 모니터링인 만큼 이와 관련된 세션에 가장 큰 관심을 두었는데 정말 다양한 도메인과 기법들이 있음을 확인할 수 있었다. 베터리의 구리 전극, 빛이 반투과되는 특수 글래스, 금속 결정, 인체 세포에 이르기까지 다양한 분야가 다루어졌으며, 이들의 공통적인 점은 nanomanufacturing의 Profile Data를 다루고 있다는 점이다. Profile Data란 두 변수 사이의 함수적 관계가 있는 데이터로 각각의 연구에서는 이를 제품이나 제조 공정의 품질을 결정짓는 중요한 요소로 간주하고 있다. 때문에 기존의 covariance는 변화하지 않는다는 가정하에 mean shift만 모니터링 하는 통계적 기법들을 더욱 개선하여 covariance의 변화도 함께 모니터링하려는 시도가 신선했다. Multi-stream signal에 대한 분석 방법도 여러가지가 소개되었는데 특히 원인을 분석하는 방법에 있어서 signal 이상에 대한 패턴을 사전에 실험하고 정의하여 이와 유사도를 분석함으로써 근본적인 문제가 무엇인지 원인을 찾는 방법론은 특히 적용 가치가 있어 보였다. 특히 원인 분석이 어려운 모델일수록 유용한 방법으로 생각된다. 그 밖에 data dimension reduction, change detection, multicollinearity에 대한 다양한 접근 방법들이 소개되었는데 모두를 이해하기에는 한계가 있는 만큼 최대한 참고 레퍼런스들을 확보하면서 항후 학습할 수 있는 seed로 삼기 위해 노력하였다. 

 시뮬레이션 분야에서는 최적화의 전통적인 문제인 창고나 기차 루트의 최적화 문제가 자주 언급되었으나 단일 레일을 가정한다던지 아니면 시스템 내의 전체적인 운반 부하가 동일하다던지 하는 현실에 적용하기에는 다소 단순한 모델의 언급이 많았던 점은 아쉬운 부분이었다.

 텍스트 마이닝 분야에서는 자기상관성 관점에서 문제를 재해석한 연구가 인상 깊었다. 기존의 Bag of word에 속한 단어들의 중요성을 수치화 하는 측정 방법으로 TF-IDF를 많이 사용하는데 이는 the나 a, is와 같이 의미는 없지만 자주 반복되는 단어들의 중요성은 줄이고 적당히 언급되는 단어들의 중요성은 높게하는 특징이 있다. 하지만 댓글의 경우 의미있는 단어 임에도 다음 Reply에서 반복적으로 자주 언급이 되는 경우에는 오히려 중요성이 낮게 측정될 수 있는데 이를 자기상관성 문제로 간주하여 TF-IDF에 새로운 Term을 추가하여 해결하는 모습이 인상깊었다. 소비자나 시장의 동향 파악을 위해 Reply나 댓글을 활용하는 경우가 많은데 이 때 매우 유용할 것으로 생각된다. 

 

4. 정 리

 아는 만큼 보인다는 말처럼 석사 2학기의 재량으로 학회에서 소개된 많은 내용들 중 일부는 이해하기 난해한 부분도 없지 않았으나 전반적인 연구의 트랜드를 알고 공통된 고민을 느낄 수 있어서 매우 유익하였다. 특히 나의 연구를 외부 전문가들에게 검증할 수 있다는 점에서 학회 참석 기회를 자주 갖고 더욱 전문적이고 구체적인 문제를 안고 함께 고민할 수 있는 자리로 활용할 수 있다면 더할나위 없겠다는 생각이 든다. 향후에는 학회를 더욱 적극적으로 활용하고 스스로도 더욱 준비된 모습으로 참여할 수 있도록 노력하겠다.