- 2014년 11월 24일 오전 10:43
- 조회수: 1480
도형록
이번 산업공학회 추계 학술대회는 40주년을 맞아 산업혁신 3.0을 위한 산업공학의 역할이라는 주제 아래에 개최되었다. 이번 학술대회에서도 다양한 주제의 발표들이 이루어졌는데, 품질 및 신뢰성, 경영과학, 인간공학 등의 산업공학의 각 분야들의 흐름과 발전 방향을 확인할 수 있는 40주년 기념 특별 강연들이 개최된 한편 이전보다 헬스케어를 주제로 한 세션들이 많이 늘어난 것을 확인할 수 있었다. 이들 중 관심이 가는 연구주제를 다음과 같이 정리한다.
"Comparison of data pre-processing techniques for relaxing class imbalance"는 데이터 불균형 문제를 전처리 과정에서 sampling을 통해 해결하는 과정에 대해 다루었다. 전처리를 통한 불균형 해결 문제에 있어 under sampling과 over sampling을 사용하는 간단한 접근법 뿐만 아니라 SMOTE, boarder line SMOTE, SPIDER와 같은 다양한 sampling 기법들을 활용하였으며, 각 sampling 기법과 좋은 조합을 보이는 분류기에 대해서까지 다룬 점이 인상적이었다. 데이터 불균형 문제는 최근 많은 분야에서 발생하는 문제인 만큼
"SVM과 HCRF를 이용한 텍스트 문서 감정 분류 모델"은 Support Vector Machine과 Hidden Conditional Random Field를 이용하여 문서 전체의 감정을 분류하는 연구에 대한 발표였다. 텍스트마이닝에 관련된 부분이라 자세한 프로세스는 이해하지 못했지만, HCRF라는 확률 모델에 대한 관심을 갖게된 계기가 되었다. Conditional Random Field는 Hidden Markov Model에서 각 관측치간의 독립성 가정을 제거한 모델이고, Hidden Conditional Random Field는 Conditional Random Field의 hidden state들에 연결되는 latent variable을 추가한 모델이다. 따라서 관측치들의 sequence를 하나의 class로 분류하는 것을 가능하게 해준다. 문서 감정 분류 이외에도 HCRF가 활용될 수 있는 주제를 찾는 것은 좋은 연구 주제가 될 것이다.