[발표 후기]

 

발표 주제: A Mixed Integer Programming Data Description Method for Control Chart

발표 Summary

정수계획법을 활용해 기존의 Convex Optimization에 기반한 SVDD가 가지고 있던 정확한 alpha 오류를 조정할 수 없다는 한계점을 극복한 MIP-DD를 디자인하고 이를 활용한 새로운 Control Chart를 만들어 제시하였다. 기존에 SVDD Control Parameter C의 경우 alpha 오류의 하한까지밖에 정하지 못한다. 그런데 본 논문에서는 Integer Programming을 도입하여 Binary Decision Variable을 활용해서 특정한 관측 데이터가 최적의 경계선 안에 들어오는지 들어오지 않는지를 결정하고, 경계선 안에 들어오는 관측 데이터의 개수를 정확하게 조절함으로서 alpha 오류를 정확하게 설정할 수 있는 새로운 One Class Classification 방법론을 만들어 제시하였다. 단순한 원의 형태의 경우 SVDD의 Primal Version과 유사하게 원의 반지름을 최소화하면서 최적 경계선 안에 들어오는 관측치 개수를 조절하도록 디자인했다. 그런데 원이나 타원이 아닌, 비정규분포를 따르는 경우에 대해서는 Dual Version을 응용하여 Kernel 함수를 적용해 복잡한 형태나 여러 개 군집이 있는 경우에 한해서도 Description을 할 수 있도록 만들었다. 알고리즘 소개를 한 후에는 원의 중심에서 관측치까지의 거리를 이상의 정도를 측정하는 하나의 숫자로 표현하는 MIP-DD 관리도를 제시하였다.

 

세션 질문

Q1. Primal 모델과 Dual 모델을 왜 따로 만들어야 하는가?

답변 : Primal 모델의 경우 원을 최소화한다는 개념이기 때문에 우리가 설명하고자 하는 데이터가 정규분포 형태를 가지고 있지 않을 때는 데이터를 제대로 설명할 수 없는 한계를 가지고 있다. 이를 극복하기 위해서 Kernel 함수를 사용해야 하고 이를 위해서는 Dual 형태의 식 구성이 필요했다.

 

Q2. 정수계획법을 풀 때 일반적으로 시간이 많이 걸리는데 해당 알고리즘은 시간이 얼마나 걸리는가? 또 어떤 Solver를 사용했는가?

답변 : Dual 형태의 문제를 풀 때는 1500개의 데이터를 가지고 실험을 하더라도 60초 이내에 해결을 할 수 있다. 실제로 사용하기 위해서 그리 오랜 시간이 걸린다고 생각되지는 않는다. 이 문제를 해결하기 위해서 Solver는 Gurobi를 사용했다. Gurobi는 Quadratic Objective, Constraint를 다룰 수 있게 해준다.

 

Q3. 어떻게 군집이 여러 개 있는 데이터도 하나의 원으로 표현할 수 있는 것인가?

답변 : 이 부분은 상식적인 공간 인식으로는 이해하기 힘든 부분이다. 사실 나도 연구를 하고 공부를 하고 있지만 상식적인 공간감으로는 쉽게 이해되지는 않는다. 하지만 상식적인 공간감을 잠시 잊어버리고 굉장히 큰 차원으로 데이터를 표현한다고 하면 복잡한 형태, 심지어 군집이 나눠진 형태도 하나의 원 안에 들어가도록 표현이 될 것이다. 그리고 Kernel 함수를 쓰게 되면 현재 2차원 상에서 어떠한 점들이 원 안에 들어있는지 표현을 할 수 있게 된다.

 

발표 후기

이번 발표는 싱가포르 학회에서도 유사한 내용으로 발표를 했고, 김성범 교수님께서도 관련 주제로 발표하셨던 것을 보고 공부했던 적이 있어서 비교적 자신있게 발표를 할 수 있었다. 마음의 여유가 있다보니 시간 조절도 적절하게 잘 해서 주어진 시간 내에 전달하고자 하는 내용을 충분히 전달했다고 생각되었다. 질문의 내용을 보았을 때 아주 세부적이고 어려운 내용이라 대강을 설명하고 넘어갔던 부분들에 대해서 질문이 나왔는데, 큰 줄기에서 내가 어떠한 이야기를 하고 있는지는 어느 정도 전달이 되었다고 생각된다. 좌장이셨던 김광재 포스텍 교수님께서도 재미있는 발표였다고 말씀해주셔서 기분 좋게 마무리할 수 있었다. 하지만 개인적으로 조금 아쉬웠던 점은 최적화 수식 설명을 모르는 사람이 봐도 직관적으로 잘 이해할 수 있도록 잘 하고 싶은데 조금 어려운 것 같다. 연구 특성상 통계를 연구하시는 분들께는 최적화를 이해시키기가 어렵고, 최적화를 연구하시는 분들께는 통계를 이해시키기가 참 어렵다. 좀 더 공부를 많이 하고 연습도 많이 해야 될 것 같다.

 
[청취 후기]

이번 학회는 산업공학과 유익한 세션도 많았고, 흥미로운 주제도 많이 발표되었다. 좋은 발표들이 많이 있었지만 가장 인상깊고 좋았던 발표들을 정리해보려고 한다.

1. Particle Map을 활용한 반도체 설비 불량 관리

이 발표는 삼성전자에서 근무하고 계시는 김세훈 고려대학교 석사과정 연구원의 발표였다. 반도체 불량을 일으키는 원인 중에 미세 먼지가 있는데, 앞으로 선 폭이 줄어듬에 따라서 이 미세 먼지가 일으킬 수 있는 불량의 위험도가 굉장히 커진다고 한다. 왜냐하면 선폭이 준다고 해서 먼지의 크기도 줄어드는 것은 아니여서 기존의 동일한 사이즈의 먼지가 좀 더 많은 회로선들을 간섭시킬 수 있기 때문이다. 그래서 현재는 이 미세 먼지에 의한 품질 손상이 미비하지만 앞으로 회로 선폭이 줄어들 경우 중요한 문제가 될 수 있다고 설명하였다. 그래서 먼지들이 쌓이는 분포를 과거 데이터를 사용해서 추정하고, 이를 관리량에 반영해서 좀 더 민감하게 측정할 수 있는 관리도를 제시하였다. 문제에 대한 정의와 의의 제시가 명확했고, 문제를 해결하기 위한 접근법도 창의적이여서 인상깊게 들었다. 하지만 제시된 방법대로 할 경우에는 alpha error가 20% 가까이 된다고 하는데, 이 부분은 실제로 사용하기 위해서는 꼭 해결되야 하는 문제라 생각되었다.

2. Robust Equity Portfolio Performance

Robust 포트폴리오라고 하는 것은 가장 성능이 안 좋은 상황을 가정해서 해당 상황을 최적화하는 Max-Min 문제 또는 Worst case Optimization에 해당한다. 최근까지 관련 연구들이 굉장히 많이 되어오고 있지만 어떠한 Measure를 사용해서 평가하는 것이 좋은 지에 대한 Consensus가 존재하지 않고, 대부분 다른 인덱스나 Case Study를 통해 비교 분석하는 정도에서 성능을 검증하는 결과가 많아서 이러한 부분을 개선하기 위해서 성능 척도를 어떻게 하는 것이 좋은 지에 대한 연구 결과 발표를 했다. 다양한 방법을 소개하고 비교한 연구 결과를 제시해서 공부가 많이 되었다. 사실 나도 관련 주제로 공동 연구를 해서 논문 작성을 하고 있어서 그런지 관심이 가는 주제였다. 연구의 취지가 좋고 앞으로 좀 더 관심을 갖고 출판이 되었을 때 한 번 공부해 보고 싶은 내용이었다.

3. Anatomy of Robo-Advisor

최근에 투자 Portfolio 관리와 관련해서 Robo-Advisor라고 하는 말이 유행처럼 번지는 것 같다. Robo라고 하는 것은 일종의 인공지능을 사용했다고 하는 것인데, 요새 빅데이터, 머신러닝과 같은 데이터 분석, 인공지능 관련 분야가 각광을 받자 마케팅 효과를 노리고서 많은 업체에서 사용하고 있는 것 같았다. 이 발표는 그러한 Robo-Advisor의 실상이 기존에 우리가 알고있던 Portfolio Optimization에 ETF의 개념을 조금 더한 정도라는 것을 말해주고 있다. 흥미로웠던 부분은 Robo-Advisor 업체가 주장하고 있는 소액의 자산들을 모아서 하는 Portfolio 투자가 정말로 실효성이 있는 지에 대한 실증 검증을 한 부분이었는데, Transaction Cost가 상대적으로 낮은 ETF를 사용할 경우 충분히 어느 정도 수익성이 보장된다는 점이 재미있었다. 단 우리 나라 금융 환경에서 가능할 지는 아직 미지수라고 한다. 세간에 유행하는 개념들은 아무 생각 없이 받아들이는 것이 아니라 학자의 입장으로서 정말로 맞는 것인지 고민하고 검증해보는 자세는 정말로 배울만 하다고 생각되었다.