<학회 후기>

  ​대한산업공학회가 주최하는 2017
추계학술대회가 대전(카이스트)에서 열렸다. 처음 참석해보는 산업공학 학회인 만큼, 그리고 전국 각지의 산업공학
관련 관계자들이 학회에 참여한다는 소식을 듣고 어떤 배움을 얻을 수 있을지 기대가 컸다. 

  학회는 프로젝트 및 연구가 소개되고 그에 대한 질문 및 토론을 하는 형식으로 진행되었는데,
개인적으로 최대한 다양한 주제의 연구들을 들어보고 관심이 가는 연구를 찾아본다는 목적으로 들어볼 발표를 골라보았다. 각 발표자에게 가장 많이 던져진 피드백은 ‘accuracy가 기존 모델과
차이가 없을 시 모델의 활용성현업에서 사용될 수 있는
현실성에 관한 것 이었다. 문제 상황이 주어졌을 때 가능성이
있는 solution을 제안하는 것도 중요하지만 그 solution
후에 어떻게 쓰일 것인가에 대해 고심하는 접근법이 중요하다는 것을 자각할 수 있었다. 현업에 계시는
분들, 연구원들, 그리고 교수님들을 통해 실제 산업에서 알고리즘과
모델을 보는 관점에 대해서 생각해 볼 수 있는 시간이었다. 뿐만 아니라, 연구실 선배들과 다른 연구자들의 학문에 대한 열정과 진지한 태도가 인상깊었다.
새로운 연구 주제를 찾고 실험을 하는 과정에서 많은 준비와 끈기가 필수적이었겠다는 생각이 들었다. 이번
학회는 어떤 연구분야에 더 관심이 가고, 완성도 있는 연구를 위해서 어떤 시각과 자세를 가지고 있어야
할 지에 대해 다시 새겨보는 자극제가 되었던 것 같다. 다음 춘계 학술대회에서 이번 학회 때 느낀 점들을
잘 반영하여 임할 수 있도록 해야겠다.  

 

 

<청취 후기>

1.    
다중손상을 고려한 응급의료수요모델링

  응급의료수요를 예측하는 기존 모델들은 응급의료 수요가 푸아송 과정에
따라 발생하다는 가정에 따라 만들어졌다. 하지만 현실적으로 적용해 보았을 때, 과분산현상이 관측되고 여러 명의 환자가 발생된다는 점을 간과함에 따라 다중손상사고에 기존 모델들의 효력이 떨어졌다. 따라서 푸아송 과정 대신 mixture distribution으로
가정 상황을 변경하고 변수에 가중치를 두는‘복합적 푸아송을 배경으로 한 모델링 방안을 제시했다. 응급의료수요를 예측하는 데 있어서 accuracy에서 기존 모델과
크게 차이가 없는 것으로 보였지만 특정 분포를 혼합하여 사건 규모를 달리한다는 새로운 발상에 연구의 의의가 있었다.

2.    
단어 자소 기반 합성곱 신경망을 이용한 문서 분류



  성공적인 문서 분류를 위해서는 각 문서들이 포함하고 있는 단어 정보를
정확하게 추출하는 것이 핵심이다. 하지만 한국어의 특성상 조사, 어근, 어미에 따라 단어의 변형이 존재하는 것을 고려하여 단어와 자소 정보를 모두 적용한 문서 분류 방법론이 제안되었다. 기존에 단어 정보만을 이용하여 text classification
했을 경우 특정 범주에 대한 과적합이 이루어졌기 때문에 이 방법론은 딥러닝의 네트워크 개념을 활용하여 단어 신경망과 자소 신경망을 따로 형성한다. 후에 이 둘을 결합할 때 자소 정보와 단어 정보의 길이 차이를 scaling
하여 마지막에 나오는 feature vector를 통해 모델링을 하는 알고리즘을 고안했다. 향후에 마지막의 특정 vector만이 아니라 첫번째 vector까지 고려하는 연구가 이루어진다면 보다 높은 분류 성능이 보일 것이라는 피드백이 있었다.

 



3.    
TF-IDF based Association Rule mining
for a Large Transaction Data



  추천 시스템에서
자주 활용되는 ‘Association rule mining’(연관규칙탐색)은 판매 상품들의 연관성을 고려하여 실제 매출에 도움을 줄 수 있도록 하는 방법론이다. 주로 Filtering 알고리즘을 적용하는데 이는 적은 거래량과
사소한 규칙을 간과하는 단점을 가지고 있다. 본 연구는 정보 반환을 할 시 문서 안의 단어가 얼마나 중요하냐라는 척도를 기준으로 score을 매기는 TF-IDF를 기존 알고리즘과 접합하여 사용했다. 거래 내역의 빈번 거래 품목에 각각 scoring을 하여 rule을 파생하는 흥미로운 주제였는데, 다만 빈번 거래 품목은 사용자가
직접 수기로 설정해야 한다는 점에서 신뢰성이 보다 떨어지지 않을까라는 의문점이 생겼다.