- 2016년 11월 21일 오전 11:16
- 조회수: 1731
이한규
■ 학회 후기
거의 1년만에 참여한 산업공학회로, 요즘의 국내 연구의 트렌드에 대해 알 수 있던 기회였다. 키워드를 정한다면 "딥러닝"이라고 생각된다 이미 발표된지 한참 되었지만, 다수의 연구들이 Autoencoder 등과 같은 neural network기반의 방법들이 모니터링, 예측, 분류등 다양한 분야에서 적용된 사례를 들을 수 있었다.
개인적으로 "Support vector machine를 위한 마진 예측기반 학습 패턴 선택 및 품질 예측 응용"으로 deep learning 기법은 아니었으나, 현재 진행하는 연구와 관점은 다르지만 상당히 유사한 접근법을 보였기 때문에 인상깊었다.
흔히들 말하는 '빅데이터'에서는 다수의 관측치를 가지고 있고, 이러한 상황에서 다양한 learning 알고리즘은 모든 데이터를 대상으로 학습(decision boundary)을 수행하기 때문에 오랜시간이 걸린다. 그런나 SVM의 경우 Support vector을 대상으로 학습이 진행되기 때문에 상대적으로 computational time이 짧아지게 된다. 이러한 접근법으로 다수의 데이터상에서 SV로 예상되는 데이터만을 우선 sampling을 하고 이를 통해 SVM 모델링을 한다면 기존에 모든 데이터를 통해 SVM을 학습한것과 학습 시간을 줄이면서 동일한 결과를 낼 수 있다는 아이디어였다. random sampling의 단점을 보완하기 위해 bootstrap방식을 적용하였으며 이를 반복하여 결과적으로 각 샘플링된 데이터를 통해 SV의 가능성이 높은 데이터를 찾았다.
내가 이번 학회에서 발표한 내용은 Imbalance와 overlap상황하에서 분류성능을 향상 할 수 있는 방법론으로 Fuzzy-SVM을 통해 overlap 지역을 분할하는 것이 주된 아이디어였다. SV는 대부분은 두개의 범주가 overlap 되었는 부분에서 나타나기 때문에 다시말해, 방법 및 관점이 다를뿐 결과적으로 overlap 지역을 찾는다는 점에서 동일한 맥락이란 생각이 들었으며, 추후 연구로 발표된 내용과 앞서 들었던 내용을 융합하여 접근해보는 것도 좋은 방법이 될 것 같았다.