고려대학교 DMQA 연구실

2014 춘계 한국BI데이터마이닝학회 - 손지은

2014년 4월 17일 오후 1:32
조회수: 1438

Reviewed by

손지은

-발표자 후기-

[발표 주제: 예측모델 기반 초지가치 감정평가 시스템 구축 및 가치 최대화 기법]

1.발표준비과정

현재는 감정평가 전문가들이 토지의 가치를 주관적으로 판단하기 때문에 객관성과 통일성이 떨어지고 신뢰성을 보장할 수 없다는 문제점에서부터 본 연구는 시작되었다.

특히 "Expert system"조차 없다는 현실에 전문가와 비전문가 모두 체계적인 토지가치 시스템 구축에 대한 필요성을 느끼고 있지만 국내에서는 아직 이에대한 해결책이 제시된 바가 없으므로 본 연구에서는 데이터마이닝 기법을 적용하여 기존 평가방법의 한계점을 극복하고 노동력과 시간을 절감하며, 빅데이터를 효율적으로 처리할 수 있는 방안에 대하여 제안하였다.

연구 초기단계인만큼 방법론 제안의 의의에 초점을 두었고, 실제 토지거래 사례를 통한 예측 결과를 포함였다.

발표자료 작성시, 처음에는 일반사용자가 부동산 감정평가에 대한 지식이 부족할것이라 생각하고 앞부분에서 Domain knowledge를 비교적 자세히 포함하였었으나 추후 감정평가의 중요성과 현재기법의 한계점에 대해서만 간단히 언급한뒤, 제안하는 방법론을 좀 더 자세히 설명할 수 있도록 준비하였다.

2.발표 시 아쉬웠던 점과 개선방향

해당 세션에서 마지막 발표였는데, 앞의 발표자가 발표시간을 초과하는 바람에 주어진 시간이 4분정도였고 결국 휴식시간까지 발표가 이어졌다.

발표는 온전하게 마쳤지만 주어진 시간안에 전달하고자 하는 주제를 효과적으로 전달하는것에 대한 중요성을 다시한번 느꼈다.
특히 '질의 응답'시간이 없어 청중들의 생각을 들을 기회가 없었다는 점에서 매우 아쉬웠다.

-청취자 후기-

[오전 세션]

1.Analytics, Part of Daily Life

초반부에는 빅데이터의 전반적인 트렌드에 대해 설명하였는데, 다양한 분야에서 데이터가 증가하는 형태에 대해 설명하고 데이터로부터의 가치 발견이 중요하다는것을 언급하였다. 후반부에는 자사의 분석시스템을 소개하고 case study를 통해 시스템의 성능을 입증하였다. case study의 내용은 300여개의 센서가 달린 보트가 있는데 센서로부터 수집된 데이터를 분석하고, 이를 기반으로 실시간 보트의 파라미터를 조정한다는 것이었다. 앞서 설명했던 빅데이터 트렌드에 비해 좀 미비하다는 생각이 들었지만 오라클 회사의 데이터분석 소프트웨어가 어떤식으로 구현되는지 알 수 있는 기회였다.

2.Big Data, Now and Tomorrow

빅데이터가 이슈화 됨에 따라 우리가 어떤 자세로 이를 받아들여야 하는지에 대해 설명하였고, 이를 "modernize" 라는 단어를 통해 개념을 소개하였다."modernize"는 새로운 필요나 습관에 적응하는것이란 뜻으로 빅데이터가 향후 어떤방향으로 발전해 나갈수 있는지 설명하였는데 인상깊었던 점은 우리가 무조건 데이터가 있으니까 분석해야하는 것이 아니라, 뚜렷한 목적을 갖아야 한다는 것이었다.

(Start with Big Question, not Big Data)

(Doubt is the Origin of Wisdom)

3.경험을 통해 확인된 빅데이터 접근 방법론과 사례

일반적인 데이터 분석 과정에 대해 설명하였다.
(주제선정-데이터 준비-현상 및 변화 감지-변화 원인 파악-예측/최적화 모델 구축)

그다지 새로운 내용은 없었으며 기본 개념에 충실하여 설명하였다. 후반부에는 데이터 과학자에 대한 이야기를 하였는데 흔히 알려진 데이터 과학자가 가추어야 할 역량(데이터 수집능력, 데이터 관리능력, 분석능력)도 중요하지만 Insight 도출 능력을 강조하였다. 내 생각에 이러한 Insight도출 능력은 기본역량과 별개의 능력이 아니라 기본역량이 충분히 갖추어 졌을때 생길 수 있는것 같다. 아무튼, 빅데이터 관련 일자리가 증가하고 있는 패턴을 통해 2017년에는 약 520,360개의 일자리가 생길것이라 예측하였으며, 이에따라 데이터 과학자 양성이 중요해짐을 언급하였다.

[오후 세션]

1.스마트 디바이스 위치 로그로부터 개일별 주요 장소 추출을 위한 클러스터링 기반 방법론

주어진 사용자 위치 로그로부터 사용자의 중요 장소를 자동으로 추출하는 방법론을 제시하였다. 최근에 논문을 읽다보면 위치정보를 활용하여 기존 연구의 방법론을 업그레이드 시킨 연구 사례가 많았다. 이는 스마트 디바이스의 보급으로 인해 개인별 위치 로그확보 가능성이 커지고, 또한 개인별 추출된 장소에 대한 활용성이 증대되었기 때문에 가능하다. 제안하는 방법론의 성능은 기존 방법론 대비 우수하였으나 error case에 대해 정의와 분류가 좀 미흡한것 같아 아쉬웠다.
질좋은 데이터 수집은 데이터 분석의 초석이 되므로 매우 가치있는 연구인것 같다.

2.모바일 라이프로그의 저전력 데이터 마이닝을 위한 트리구조 베이지안 네트워크

과거에 학회에서 들었던 모바일 라이프로그에 대한 연구들은 데이터 수집과 활용측면에 초점에 맞춰져있었는데 트리구조 네트워크 알고리즘을 사용하여 고수준 상황추론을 하였다.

실험 결과 정확도는 기존방법보다 2%정도 낮았지만 전력 소모량은 0.5배 감소하였다.

기본적으로 트리구조에도 종류가 많은데 다른 트리구조 적용시 결과가 어떨지 궁금했다.

Conference