고려대학교 DMQA 연구실

2018 BI Conference - 알수없음

2018년 4월 13일 오후 5:06
조회수: 1490

Reviewed by

알수없음

[학회 후기]

이번 2018 춘계 한국BI데이터마이닝학회에 ‘합성곱 신경망을 이용한 스타크래프트 경기 승패 예측’ 주제로 다녀왔다. 본 주제를 팀원들과 함께 연구하며 가장 어려웠던 부분은 실제 게임 리플레이 동영상에서 파싱된 데이터셋을 합성곱 신경망에 Input하는 부분과, 수 많은 경우의 수를 가진 전투 게임에서 무엇을 기준으로 어떻게 경기 승패를 좌지우지하는 시점을 수립하는 것이었다. 기존 연구에 의하면 실제 게임 데이터가 아닌 시뮬레이션 데이터를 사용했고, 수십 개의 유닛과 상태를 갖는 게임에서 제한적인 변수만을 적용했다.

StarCraft 게임의 특성 상 게임이 시작되는 순간부터 어느 한 쪽이 승/패가 판가름 될 때까지 항시 전투가 이벤트성 그리고 연속적인 소모전이 발생한다. 이에 착안하여 실제 프로게이머 리플레이 데이터를 확보한 우리는 “전투가치판단(Mezzo level)” 에 집중하여 연구를 진행했다. 경기 승패 예측모델의 x는 유닛 및 건물의 상태 그리고 y는 경기의 승/패 이다. Raw Data는 각 경기마다 게임 시작 0분00초부터 경기종료 될 때까지 기록된 Framecount이다. 합성곱 신경망 모델링을 위해 Feature map 생성에서 Channel 단위는 ‘건물 및 유닛별 상태’ 로 정의했다. 경기 승패 예측의 결과 Testing에서 71%의 정확도를 보였다. 앞으로 생각하기에 실시간 전략 게임(RTS)라는 Bot 개발을 위해 심히 연구해야 할 부분이 많다. 1) 세 종족이 가진 각각의 전력의 반영 2) 전투 지형의 어떠한 위치에서 싸워야 승리할지 3) Fog-of-War 라는 상대 적군의 전력을 탐색할 수 없는 것에 무슨 방법으로 해결할지가 숙제이다.

[청취 후기]

행렬 분해를 활용하는 협업 필터링 모델의
학습 최적화를 위한 데이터 선별 관점에서의 메타러닝

추천시스템은 사용자에게 제공하는 서비스에서 찾고자 하는 그리고 필요로 하는 콘텐트를 추천해 주어 선택의 다양함과 서비스를 효과적으로 이용할 수 있게 해준다.

텍스트 콘텐트의 추천을 위해 가용할 수 있는 데이터는 매우 방대하다. 이에 단순히 많은 데이터를 수집해서 모델을 구축하는데 이용하는 것이 아니라 보다 양질의 데이터를 사용자들에게 제공하기 위해 추천시스템의 많은 문제점들이 있다.

협업 필터링 모델은 콘텐트 기반으로 추천하는 방법론이 아닌 사용자가 콘텐트에 대해 선호도를 나타내거나 평가한 결과를 사용해 추천을 한다. 이 협업 필터링은 새로운 콘텐트가 들어올 경우 사용자에게 추천을 해주기 어렵다는 약점이 있다 왜냐하면 새로운 콘텐트에 대해 사용자의 선호와 평가가 아직 나타나지 않았기 때문이다.

행렬 분해는 협업 필터링 모델 기반 추천 시스템에서 주로 사용하는 것이다. 사용자와 콘텐트 사이의 선호에 대해 행렬로 표현을 한다. 이를 저차원의 잠재변수에 매핑된 두 개의 행렬로 분해하는 기법이다.

메타러닝은 분류 과정에서 어떤 데이터를 학습할 것 인지 모델이 스스로 학습해서 학습과정을 학습하는 모델 이라고 발표자는 설명했다.

발표자의 연구 결과에서 분포를 임의로 수정을 해서 분포의 특성만으로 인해 수렴 속도의 차이가 있음을 보여줬다. 또한, Sparseness 문제가 발생을 하고 수렴 속도가 굉장히 느려지는 사태가 발생한다고 한다. Data Sparseness 문제는 방대한 양의 데이터 중 특정 event가 매우 적게 나타나는 문제이다. 실제 상황에서Sparse 한 데이터가 굉장히 많이 만들어 지는데(대략 10%) 좋은 모델을 빨리 학습 시켜주기 위해, 발표자가 제안한 방법론으로 같은 데이터를 쓰더라도 조금 더 좋은 모델을 만들 수 있다고 제시했다.