고려대학교 DMQA 연구실

2019 한국데이터마이닝학회 추계학술대회 - 백인성

2019년 12월 3일 오전 11:36
조회수: 555

Reviewed by

백인성

[학회 후기]

11월 29일(금)에는 고려대학교에서 데이터마이닝 학회가 있었다. 개인적으로 데이터마이닝 학회는 3번째로 참석하게 된 학회로 대학원 진학한 이후 가장 많이 참여한 학회였다. 이번 데이터마이닝 학회에서 느꼈던 점은 연구실에서 이야기 나왔던 연구 주제들에 대해서 타 연구자들도 많이 연구를 하고 있다는 사실이었다. Multi-task Learning, Meta Learning, Attention, Transfer Learning 등의 다양한 주제에 대한 발표가 진행되었는데, 이러한 내용은 우리 연구실에서도 많이 연구가 진행 되고 있는 주제이기 때문이다. 그래서 개인적으로 흥미로운 발표 주제가 많았다고 생각한다. 또한 이와 같은 다양한 주제에 대해 사전에 알 수 있도록 해준 동료 연구원들에게 감사함을 느꼈다. 반면에 스스로에 대해서는 더 많은 공부가 필요하다고 생각이 들었다. 이러한 다양한 주제에 대해서 컨셉 뿐만 아니라 각 내용에 대한 깊은 이해가 필요하다고 생각했기 때문이다. 2019년 2학기 동안 INFORMS부터 데이터마이닝 학회까지 여러 학회를 참석하면서 좋은 연구를 진행하기 위해서는 각 알고리즘 별 깊은 공부가 필요하다는 사실을 절실히 깨달았다. 이에 대해 반성하는 것으로 끝나는 것이 아닌 지속적인 공부를 할 수 있도록 노력할 것이다.

[발표 후기]

주제. 게임 리플레이 내 이미지 정보를 순차적으로 활용한 경기 승패 예측

게임 리플레이 내 이미지 정보를 순차적으로 활용해서 경기 승패 예측한 연구 내용을 발표하였다. 게임은 실시간 전략 게임 중 하나인 스타크래프트2를 활용하였고, 딥마인드에서 제공하는 패키지를 활용하여 리플레이 데이터 내 변수를 추출하였다. 이미지 정보를 순차적으로 활용하기 위해서 3D-ResNet CNN 모델을 구축해서 경기 승패를 예측하였다. 스타크래프트와 같은 실시간 전략 게임은 경기 내 초반 시점과 후반 시점 승패에 미치는 영향력이 다르다. 경기 초반 시점은 전투가 크게 발생하지 않기 때문에 경기 승패에 영향을 크게 미치지 않는다. 경기 후반 시점은 경기 결과와 직결 되는 전투가 일어나는 경우가 많기 때문에 경기 결과에 영향을 크게 미치게 된다. 따라서 본 연구에서는 영향력이 적은 경기 초반과 경기 결과에 크게 영향을 미치는 후반 시점을 제거하면서 실험을 진행하였고, 최종적으로 경기 초반과 후반 특정 시점을 제거하더라도 좋은 성능을 보이는 모델을 구축할 수 있었다.

질문1. 주요 상황이나 시점을 알 수 있는 알고리즘을 적용해 본 적이 있는지?

답변1. 현재 CAM(Class Activation Map)을 적용해서 주요 시점 및 주요 상황을 확인한 사례가 있다. 테란이 초반 마린 러쉬를 했을 때 이를 프로토스가 막았던 시점을 주요 시점으로 뽑았던 사례가 있었다. 그리고 이후에 추가적으로 Attention 방법론도 도입해 볼 예정이라고 답변했음.

질문2. 샘플링을 했다면 리플레이 내 데이터를 얻은 시점 간 간격이 존재하는지?

답변2. 샘플링을 했기 때문에 연속 된 시점이 아니고 시점 간 간격이 존재한다고 답변했음.

[청취 후기]

주제. Meta learning을 이용한 multitask learning(이성재, 손영두 – 동국대학교)

해당 발표는 제목만으로도 기대가 컸던 주제였다. 우리 연구실에서도 최근 현규가 VOC 데이터를 Multi-task Learning으로 분석한 사례가 있었고, Meta Learning 관련해서도 세미나가 진행된 적이 있었기 때문이다. 본 발표에서는 Shared Layer를 통해 Multi-task Learning 모델에 대해 공통적인 parameter를 추정하는 것이 아니라, Shared Layer를 통과한 이후 각 Task에 따라 각각의 parameter를 추정하고 각각 추정된 parameter를 통해 다시 모델의 공통적인 parameter를 추정하게 된다. 개인적으로 이 아이디어에 대해 흥미롭다고 생각했다. 그리고 이렇게 parameter를 따로 추정한 이후 다시 하나의 parameter를 추정한 경우와 기존 방식대로 parameter를 추정해 모델을 구축 했을 때, 차이점이 무엇인지에 대한 기대감을 있었다. 하지만 두 방법론 사이에 명확한 차이를 알 수 없었던 것이 개인적으로 아쉬움으로 남았다. 모델 성능이 개선되거나 parameter를 더 효율적으로 추정한다거나 하는 차이점에 대한 결과가 명확 했으면 좋았을 것 같다는 생각을 했다.

Conference