고려대학교 DMQA 연구실

2018 대한산업공학회 추계학술대회 - 강현구

2018년 11월 13일 오후 10:16
조회수: 894

Reviewed by

강현구

[발표 후기]

Clear the Fog: Image Completion in Partially Observed Games with Deep Learning

가장 유명한 실시간 전략 시뮬레이션 게임(Real-time Strategy Game) 중 하나인 스타크래프트는 현실의 많은 문제를 담고 있다는 점에서 인공지능 연구에 적합한 환경으로 평가 받는다. 스타크래프트가 쉽사리 인공지능으로 정복되지 않는 큰 이유 중 하나는 바로 비대칭 정보 게임(Partially Observed Game)이기 때문이다. 이미 인공지능이 정복한 체스와 바둑처럼 게임의 상태정보(state information)가 모든 플레이어에게 동일하게 주어지지 않기 때문에 게임에서 발생할 수 있는 경우의 수는 기하급수적으로 증가하게 된다. 이러한 문제를 스타크래프트에서 전장의 안개(fog-of-war)라고 부른다. 본 연구에서는 합성곱 오토인코터(convolutional autoencoder) 구조를 활용하여 안개에 가려진 상대방의 유닛 정보를 예측하는 모델을 제안하였다. 모델의 성능에 대한 평가는 결과에 대한 시각화와 함께 경기의 승패를 예측하는 추가적인 CNN 모델의 예측 성능을 비교하여 제안 모델의 우수함을 보이고자 하였다.

Q1. 시각화 결과로 보여준 유닛의 종류들 이외에도 프로토스 대 테란 게임의 승패에 큰 영향을 주는 유닛들이 있는데, 그에 대한 예측성능은 따로 확인하였는가?

A1. 아쉽게도 질문자가 언급한 유닛들에 대한 정보는 이미 게임 플레이 당시 정찰을 통해 어느정도 파악하고 있었기 때문에 실제 예측에서 제외되는 경우가 많았다. 해당 부분을 예측할 수 있도록 프레임워크를 변경할 계획이다.

[청취 후기]

Recurrent Attention Model(RAM)을 이용한 객체 탐지 방법론

강화학습을 활용하는 Glimpse Network의 구조를 객체탐지(object detection) 문제에 활용하는 방법을 제안하는 연구였다. 2014년에 Glimpse Network가 처음 제안될 당시에는 단순 이미지 분류를 위해서 사용되었던 것을 객체탐지 문제로 확장시킨 점에서는 아이디어가 단순하면서도 효과적이라고 볼 수 있는 것 같다. 처리 코드가 복잡하다보니 완벽한 결과를 보여주지 못한 것은 조금 아쉬웠지만, 강화학습의 보상(reward)를 매 glimpse step마다 부여할 경우 모델의 성능 개선도 가능할 것으로 보인다. 최근 객체탐지 및 이미지 세그멘테이션(image segmentation)에서 스탠다드로 자리잡은 Mask RCNN 구조도 함께 활용하여 적용해보면 좋을 것 같다.

Conference