- 2016년 4월 19일 오후 1:18
- 조회수: 1986
박영준
<발표후기>
이번
학회에서는 NCsoft
와
산학프로젝트를 진행하는 동안 수행한 연구 내요을
발표하였다.
연구의
내용은 야구기사와 선수 기록을 활용한 딥러닝 기반의
감성 분석 모델이다.
본
연구의 주요한 contribution은
크게 두 가지가 있다.
첫째는
레이블이 없는 뉴스 기사에 대해 레이블을 부여하는
방법이다.
둘째는
감성분석을 수행하는데 있어 온톨로지를 사용해야만
하는 경우가 있는데 사람의 주관이 들어간 온톨로지를
사용하지 않고 딥러닝을 이용한 감성분석 모델을
제안하였다.
이
중 첫번째,
레이블
부여 방법론에 대해서는 본 연구에서 가정하고 있는
사항에 대해 검증을 하지 못해 설득력이 약하다는
부분을 깨달았다.
추후
논문을 작성하는데 있어 반드시 보완해야 할 부분이라고
생각한다.
본
세션에서 발표를 마치고 앞으로 더 좋은 연구 결과물이
나올 수 있도록 좌장을 맡으신 교수님 외 몇몇 교수님들께
질문과 코멘트를 받았다.
이
내용을 정리해 보도록 하겠다.
-
질문사항
질문
1.
야구
기사가 나오는 시점에서 선수의 스탯 역시 동시에
나오게 된다.
기사와
스탯을 X-Y
관계가
아니라 X1,
X2의
관계로 입력변수로서 분석할 수도 있지 않았나?
답변:
스탯은
선수에 대한 정량적인 정보만을 담고 있어 한계가 있는
부분이 있다.
가령
팀이 크게 이기고 있는 상황에서의 홈런과 역전 결승
홈런은 다른 의미를 갖고 있다.
따라서
이런 의미의 차이를 반영하여 선수를 평가하기 위해서는
기사를 통해 접근하는 것이 맞다고 생각하다.
답변후기:
본
질문은 이전에 연구를 수행하면서 프로젝트 팀원에게
내가 했던 질문이었다.
당시
이 질문에 대한 답변을 준비한대로 답변을 했다.
한가지
아쉬운 부분이 남는것은 감성분석 모델을 평가하는데
주로 사용하는 데이터인 영화감상평 데이터의 경우에도
마찬가지로 리뷰와 점수를 한 사람이 동시에 입력하지만
이를 X-Y
관계로
놓고 모델을 구성한다.
이러한
내용을 함께 답변했으면 더 좋았을 것이라는 생각이
든다.
질문
2.
결국
기사로 부터 누가 베스트 플레이어가 될 지 예측하는
모델이 아닌가?
스탯으로만
예측했을 때와 텍스트를 통해서 예측했을 때 어떤
차이가 있는지 보이는것도 재밌을 것 같다.
답변:
뉴스기사에는
레이블이 없기 때문에 베스트 플레이어 여부를 이용하여
기사에 대해 레이블을 부여한것이다.
말씀하신
내용은 추후 연구를 진행하는데 참고하도록 하겠다.
답변
후기:
본
연구는 감성 분석 모델을 구성하는데만 촛점을 맞춰
진행하였다.
이러한
감성 분석 모델이 어디에 사용될 수 있는지 적절한
케이스 스터디가 추가로 수행되면 더 좋을 것이라
생각했다.
질문
3.
스탯을
감성으로 매칭 시킨 가정이 약하고,
다른
방법론들과 비교를 수행하면 논문을 작성하는데 도움이
될 것이다.
답변:
저희도
그 부분에 대해 동의하고 있으며 향후 연구에서는 다른
방법론들과 비교를 통해 제안기법을 검증할 수 있도록
하겠다.
답변
후기:
스탯을
감성으로 매칭 시키고 이를 통해 뉴스 기사에 레이블을
부여하는 방법은 나름의 가정사항에 대해 검증을 하지
못해 설득력이 떨어진다고 생각한다.
이
부분에 대해서 향후 연구에 반영해야 한다고 생각한다.
또한
다른 방법론들과의 비교를 통해 제안기법이 어느정도
성능이 높은지 낮은지에 대한 가이드로 할 수 있어야
한다고 생각한다.
<청취후기>
1.
Audible
range prediction for hearing aids using cascade recurrent neural
networks
난청환자를
위한 보청기는 환자에 맞게 튜닝하는데 많은 시간과
노력이 필요하다고 한다.
이를
좀더 수월하게 하기 위해 본 연구에서는 환자의 가청
주파수를 예측하는 모델을 구성하여 안들리는 주파수의
음량을
늘려 보청기의 튜닝을 잘 할 수 있도록 하는 가이드
라인을 마련하였다.
우선
실생활에 이러한 문제가 있는지 몰랐는데,
이러한
문제를 발굴했다는 부분에서 훌륭한 연구라고 생각한다.
또한
본 연구에서 사용한 cascade
recurrent neural networks를
이용하여 인공신경망이 시계열 문제에 이와 같은
방식으로도 예측가능하다는 것을 배울 수 있는 기회였다.
하지만
사용한 변수가 임상적 질의응답,
직업,
성별,
나이
등의 인구통계학적 정보만 사용한것은 recurrent
neural network를
꼭 서야 하는지에 대한 의문이 남는다.
다른
알고리즘으로도 cascade
방식의
예측을 수행할 수 있을 것 같다.
2.
Convolved Gaussian process for multi-step ahead time series
forecasting
본 연구는 시계열 데이터에 대해 예측을 수행하는데 있어 multi-task learning의 관점으로 예측하는 방법론에 대해 다뤘다. 시계열 예측을 수행하는데 있어서 예를들면, 한 시점 후 부터 5시점 까지 예측한다고 했을 때 현재 구성한 모델을 이용해 예측해야 하는 Y는 5개가 된다. 기존에는 5개를 예측하기 위한 개별의 모델을 구성했다면 하나의 모델을 이용하여 5 시점을 예측하는 모델을 구성해보자는 것이 본 연구의 방향이었다. 결국 더 적은 수의 모델 (적은 수의 파라미터) 시계열 예측을 수행할 수 있는 방법론을 제안한 것이다. 이때 사용한 모델은 Gaussian process regression을 사용하였다. 이번 발표를 통해서 시계열 예측에 대해서 어떤 식으로 예측 방법론을 수립할 수 있는지 배울 것이 많은 발표여서 좋았다.