- 2018년 4월 13일 오후 2:28
- 조회수: 1966
이지윤
서울 코엑스 컨벤션센터에서 개최된 한국 BI데이터마이닝 학회는 '인공지능 시대의 데이터 사이언스'라는 주제로 진행되었다. 지난 대한산업공학회의 경우 산업공학의 다양한 분야 연구에 대해 접해볼 수 있었다면, BI 데이터마이닝 학회는 데이터 애널리틱스를 기반으로 하는 연구들에 초점을 두어 기업별 세션과 초청 강연들이 충분히 마련되어 있었기 때문에 데이터 분석의 이론적인 방법론이 산업에 적용되는 과정에 대해 면밀히 살펴보며 데이터마이닝이 산업에서 광범위하게 다루어지고, 이를 해결하기 위한 창의적이고 적극적인 연구가 활발히 이루어지고 있음을 알 수 있었다. 뿐만 아니라 학술 세션에서도 기존에 자주 접하지 못한 생소하고, 흥미로운 주제들로 구성되어 데이터 분석이 생명공학, 사회학, 미디어 분야로도 영역이 넓어지고 있다는 것을 느낄 수 있었다. 또한 기업들이 데이터 분석을 활용해 의사결정을 하고, 핵심 구성요소로 활용하기 때문에 데이터분석의 정확도 뿐만아니라 담당자가 직관적으로 이해할 수 있도록 해석하는 것도 중요한 요소임을 깨달을 수 있는 기회였다.
[청취 후기]
-Emotion Recognition from Text using Deep Neural Networks
기존에 제시된 감성분석 방법론으로‘Binary Sentiment Analysis’가 있으며, 결과값으로 ‘긍정’,‘부정’의 이진값이 출력된다. 해당 연구는 Chatbot Application의 목적에 부합하도록 다양한 감성을 출력하는 ‘Multi-class Sentiment Analysis’를 Deep Learning알고리즘인 MLP, CNN, LSTM, LSTM LSA based dist 통해 구현하고자 하였다. 기존의 방법론에서 감정간 Correlation을 살펴보면 joy와 sadness가 유사한 감정으로 해석되는 문제가 있었고, 이를 개선하기 위해 LSA(Latent Semantic Analysis)를 도입하여 감정간 유사도를 거리기반으로 변환하여 유사도를 판단하기 때문에 기존의 방법론보다 감정간 관계가 잘 구별되는 것을 확인할 수 있었다. 해당 연구는 감성분석에 대해 기초적인 접근에서 간단한 변환을 통해 기존의 방법을 개선했다는 결론이 있었으나 Accuracy를 비교해보면 기존의 방법론보다 낮은 Accuracy구간들이 있었다. 따라서 이런 이상 구간에 대한 분석이 부족했다고 느껴졌고, 감정에 대해 그래프에서 Axis에 대해 명시해 놓지 않아 이해하는데 어려움이 있었다. 그럼에도 불구하고 사람의 감정을 Multi-class로 구현하여 적절한 감정간 거리를 찾는다는 점에서 상당히 흥미로웠다. 추후 추가적인 검증과 위 기법을 직접 적용한 사례연구까지 기대가 된다.
-기계학습을 이용한 장기카드대출 가망고객 예측
금융사는 예대마진(대출이자에서 예금이자를 뺀 나머지 부분)으로 수익이 창출되는 구조이다. 따라서 부실채권이 발생하는 확률인 부실률을 낮추며 예대마진률을 높이는 것이 수익성이 좋은 금융상품이라 할 수 있고, 본 연구는 신용등급 대비 우량한 고객을 대상으로 대출을 실행하여 수익성을 높이되 대출 고객 심사시 잠재적 부실가능성이 있는 고객을 선별하는 기계학습 방법론을 제시하였다. 먼저 기계학습 과정에서 부실 고객의 수가 정상고객대비 낮아 생기는 데이터 레이블의 불균형문제를 해결하기 위해 SVM을 데이터 샘플링에 도입하여 정상고객 중 Hyperplane에 근접한 데이터들을 추출하고, 남은 부분에 대해서만 Random Sampling을 사용하여 부실가능성에 가까운 정상고객들에 대한 분석이 효과적이었다. 다음으로 Graph based Semi Supervised Learning을 도입하여 신규고객에 대한 레이블링을 구현하였고, 고객에게 대출 가능성에 대해 설명하기 용이하게 구현하였다. 해당 연구는 금융사 보안으로 데이터의 수집과정과 구조에 대한 설명이 부족하여 너무 컨셉적으로만 파악할 수밖에 없는 아쉬움이 남았지만 평소에는 접하지 못했던 금융권에서의 적용과정을 이해할 수 있어 흥미로웠고 금융권에서의 빅데이터 분석 플랫폼 구축이 사회적으로 이슈가 되는만큼 앞으로 더욱 활발한 연구가 진행될 것이라는 기대가 된다.