고려대학교 DMQA 연구실

2016 IJIE 학회 - 손지은

2016년 10월 13일 오후 3:50
조회수: 2396

Reviewed by

손지은

-발표자 후기-

[발표 주제: Content-based Filtering for Recommendation Using Multi-attribute Network]

1.발표준비과정

추천시스템은 크게 Collaborative filtering(CF)과 Content-based filtering(CBF) 기법으로 나뉠 수 있다. 학계에서는 CF가 다양한 Domain에서 우수한 성능을 나타낸다고 알려져 있는 반면, CBF는 아이템간의 유사도 측정에 어려움이 있어 대부분 문서, 뉴스와 같은 텍스트 데이터 분야에서 연구되어져왔다. 본 연구에서는 텍스트 형식이 아닌 Domain에서도 아이템 간 유사도를 잘 측정할 수 있도록 최대한 많은 Attribute 정보를 수집하여 Multi-attribute Network를 구성하였다. Attibute가 많아지면 Data가 Sparse 해져서 계산량이 많아지고 유사도 측정이나 군집이 어려워 진다. 특히 Matrix를 기반으로 수행되는 방법론은 아이템간의 직접적인 관계만 고려하므로 간접적인 관계나 아이템 간 구조적 특성을 파악하기 어렵다. 그러나 네트워크 분석은 이와같은 문제를 해결함으로써, 궁극적으로 더욱 만족스러운 추천 성능을 기대할 수 있다. 실제로 MovieLens데이터를 통해 실험한 결과 기존의 CBF 기법보다 우수한 성능을 나타냄을 확인하였다.

CBF이 본질적인 문제점을 설명하기 위해 Introduction 부분에서 과일을 추천해주는 예시를 들었으며, 제안하는 방법론에서는 각 단계를 수행하는 의미와 이유에 대해 강조하려고 노력하였다. 주어진 발표시간이 촉박하지 않았던터라 보다 상세히 알고리즘을 설명할 수 있었다.

2. 질문 및 대답
질문 1: 여러개의 Attributes를 사용하여 네트워크에서 Weighted link를 나타내었는데, 각 Attribute 간의 Weight를 따로 고려하지 않았는가
대답 1: 본 연구에서는 모두 같은 Weight를 갖도록 하였다.

질문 2: 기존의 기계학습을 활용한 CBF와 비교하였을 때, Multi-attribute Network가 가지는 장점이 무엇인가?
대답 2: Attributes가 많아질 경우, Item-attributes matrix는 Sparse 해진다. 기존의 기계학습 방법론은 Sparse matrix에서 좋은성능을 보이지 못한다. 특히 아이템간의 간접적이고 구조적인 관계를 분석하기 위해서는 Network 분석이 효과적이다.

3.발표 시 아쉬웠던 점과 개선방향
아이템의 속성표현할 수 있는 Attribute는 매우 많다. 기존의 Featrue weighting이나 Feature extracting방법은 그 많은 속성 중, 어떤 속성이 사용사 만족도에 영향을 끼치는가를 선별하기 위한 접근방법이다. 하지만 그런 방법은 근본적인 해결책이 아니다. Attributes를 최대한 활용해 다양한 아이템 군집을 잘 하는것이 보다 의미있는 접근이다. 이러한 내용을 Literature review에서 좀 더 강조했으면 하는 아쉬움이 있다. 그리고 첫번째 질문은 실험을 하면서 생각을 많이 했던 부분이다. 현재 실험에서는 주연배우만 Attribute정보로 활용했지만 조연배우 Attribute가 추가된다면 두개의 Attributes는 같은 Weight를 가질것인가? 기존의 feature weighting 기법은 사용자들의 과거 점수 데이터를 활용해서 feature간 weight를 다르게 했는데 그 방법을 적용한 다음 제안하는 방식인 Multi-attribute Network를 생성하는 것도 의미있는 연구가 될 것 같다. 실제 온라인 서비스에서는, 사용자들의 과거 점수데이터 확보에 어려움이 있다면 전문가의 Domain knowledge를 통해 Weight를 조정 할 수도 있겠다.

-청취자 후기-

Forecasting Wheat Consumption of Pakistan Considering Social and Economic Factors
파키스탄에서 밀 소비량은 지역마다 다르다. 밀의 소비량 예측은 생산계획을 세우는데 있어 중요한 역할을 함에도 불구하고 현재까지 밀의 생산량을 예측하는 문제를 다룬 연구는 많지만 소비량을 예측한 연구는 없다. 발표자는 Social 및 Economic의 직접적, 간접적 요인들을 통해 밀 생산량을 예측하였다. 예측 알고리즘은 AR(1)과 회귀분석을 이용한 Hybrid 모델을 사용하였다. 밀 소비에 있어 영향을 끼치는 요인에 대한 Reference가 좀 부족해 보였는데 이점을 보완한다면 예측성능이 더욱 좋아지겠다.

A Fundamental Robot Work System Equipped with the Self-Improvement Mechanism
로봇에게 손동작을 가르치는 것은 Production system에서 중요한 연구 중 하나이다. 발표자는 양팔동작 로봇이 스스로 Assembly work를 향상시킬 수 있는 방법론을 제안하였다. 먼저 초기 Assembly work를 로봇에게 학습시키고, 행동들을 캡쳐한 다음 Motion study를 한다. 발표자는 Toy block을 통해 제안하는 알고리즘의 성능을 평가하였다. Motion study은 작업동작을 최소의 요소단위로 분해하여 각 단위의 차이를 측정해서 표준작업방법을 알아내기 위한 연구이다. 본 연구에서는 작업상의 동작을 18가지의 기본요소로 분해하고 그 최소 단위를 Therblig으로 지칭하는 Therblig analysis 수행하였다. 인간 육체의 활용을 위한 법칙을 찾기위한 방법론을 로봇 동작에 적용한 흥미로운 연구였다.

Conference