<발표후기>


 

이번
학회에서는
NCsoft

산학프로젝트를 진행하는 동안 수행한 연구 내요을
발표하였다
.
연구의
내용은 야구기사와 선수 기록을 활용한 딥러닝 기반의
감성 분석 모델이다
.

연구의 주요한
contribution
크게 두 가지가 있다
.
첫째는
레이블이 없는 뉴스 기사에 대해 레이블을 부여하는
방법이다
.
둘째는
감성분석을 수행하는데 있어 온톨로지를 사용해야만
하는 경우가 있는데 사람의 주관이 들어간 온톨로지를
사용하지 않고 딥러닝을 이용한 감성분석 모델을
제안하였다
.

중 첫번째
,
레이블
부여 방법론에 대해서는 본 연구에서 가정하고 있는
사항에 대해 검증을 하지 못해 설득력이 약하다는
부분을 깨달았다
.
추후
논문을 작성하는데 있어 반드시 보완해야 할 부분이라고
생각한다
.

세션에서 발표를 마치고 앞으로 더 좋은 연구 결과물이
나올 수 있도록 좌장을 맡으신 교수님 외 몇몇 교수님들께
질문과 코멘트를 받았다
.

내용을 정리해 보도록 하겠다
.






-
질문사항



질문
1.
야구
기사가 나오는 시점에서 선수의 스탯 역시 동시에
나오게 된다
.
기사와
스탯을
X-Y
관계가
아니라
X1,
X2

관계로 입력변수로서 분석할 수도 있지 않았나
?






답변:
스탯은
선수에 대한 정량적인 정보만을 담고 있어 한계가 있는
부분이 있다
.
가령
팀이 크게 이기고 있는 상황에서의 홈런과 역전 결승
홈런은 다른 의미를 갖고 있다
.
따라서
이런 의미의 차이를 반영하여 선수를 평가하기 위해서는
기사를 통해 접근하는 것이 맞다고 생각하다
.






답변후기:

질문은 이전에 연구를 수행하면서 프로젝트 팀원에게
내가 했던 질문이었다
.
당시
이 질문에 대한 답변을 준비한대로 답변을 했다
.
한가지
아쉬운 부분이 남는것은 감성분석 모델을 평가하는데
주로 사용하는 데이터인 영화감상평 데이터의 경우에도
마찬가지로 리뷰와 점수를 한 사람이 동시에 입력하지만
이를
X-Y
관계로
놓고 모델을 구성한다
.
이러한
내용을 함께 답변했으면 더 좋았을 것이라는 생각이
든다
.










질문
2.
결국
기사로 부터 누가 베스트 플레이어가 될 지 예측하는
모델이 아닌가
?
스탯으로만
예측했을 때와 텍스트를 통해서 예측했을 때 어떤
차이가 있는지 보이는것도 재밌을 것 같다
.






답변:
뉴스기사에는
레이블이 없기 때문에 베스트 플레이어 여부를 이용하여
기사에 대해 레이블을 부여한것이다
.
말씀하신
내용은 추후 연구를 진행하는데 참고하도록 하겠다
.






답변
후기
:

연구는 감성 분석 모델을 구성하는데만 촛점을 맞춰
진행하였다
.
이러한
감성 분석 모델이 어디에 사용될 수 있는지 적절한
케이스 스터디가 추가로 수행되면 더 좋을 것이라
생각했다
.










질문
3.
스탯을
감성으로 매칭 시킨 가정이 약하고
,
다른
방법론들과 비교를 수행하면 논문을 작성하는데 도움이
될 것이다
.






답변:
저희도
그 부분에 대해 동의하고 있으며 향후 연구에서는 다른
방법론들과 비교를 통해 제안기법을 검증할 수 있도록
하겠다
.






답변
후기
:
스탯을
감성으로 매칭 시키고 이를 통해 뉴스 기사에 레이블을
부여하는 방법은 나름의 가정사항에 대해 검증을 하지
못해 설득력이 떨어진다고 생각한다
.

부분에 대해서 향후 연구에 반영해야 한다고 생각한다
.
또한
다른 방법론들과의 비교를 통해 제안기법이 어느정도
성능이 높은지 낮은지에 대한 가이드로 할 수 있어야
한다고 생각한다
.














<청취후기>






1.
Audible
range prediction for hearing aids using cascade recurrent neural
networks






난청환자를
위한 보청기는 환자에 맞게 튜닝하는데 많은 시간과
노력이 필요하다고 한다
.
이를
좀더 수월하게 하기 위해 본 연구에서는 환자의 가청
주파수를 예측하는 모델을 구성하여 안들리는 주파수의
음량을
늘려 보청기의 튜닝을 잘 할 수 있도록 하는 가이드
라인을 마련하였다
.
우선
실생활에 이러한 문제가 있는지 몰랐는데
,
이러한
문제를 발굴했다는 부분에서 훌륭한 연구라고 생각한다
.
또한
본 연구에서 사용한
cascade
recurrent neural networks

이용하여 인공신경망이 시계열 문제에 이와 같은
방식으로도 예측가능하다는 것을 배울 수 있는 기회였다
.
하지만
사용한 변수가 임상적 질의응답
,
직업,
성별,
나이
등의 인구통계학적 정보만 사용한것은
recurrent
neural network

꼭 서야 하는지에 대한 의문이 남는다
.
다른
알고리즘으로도
cascade
방식의
예측을 수행할 수 있을 것 같다
.










2.
Convolved Gaussian process for multi-step ahead time series
forecasting


 본 연구는 시계열 데이터에 대해 예측을 수행하는데 있어 multi-task learning의 관점으로 예측하는 방법론에 대해 다뤘다. 시계열 예측을 수행하는데 있어서 예를들면, 한 시점 후 부터 5시점 까지 예측한다고 했을 때 현재 구성한 모델을 이용해 예측해야 하는 Y는 5개가 된다. 기존에는 5개를 예측하기 위한 개별의 모델을 구성했다면 하나의 모델을 이용하여 5 시점을 예측하는 모델을 구성해보자는 것이 본 연구의 방향이었다. 결국 더 적은 수의 모델 (적은 수의 파라미터) 시계열 예측을 수행할 수 있는 방법론을 제안한 것이다. 이때 사용한 모델은 Gaussian process regression을 사용하였다. 이번 발표를 통해서 시계열 예측에 대해서 어떤 식으로 예측 방법론을 수립할 수 있는지 배울 것이 많은 발표여서 좋았다.