- 오전 세션

1. 박헌진 BI 학회장, 조성식 SAS 사장의 인사말을 시작으로 "Big Data 시대에 BI의 길을 묻는다"를 주제로 학회가 진행되었다. 주로 현재 시대에서 데이터 분석의 중요성을 언급하였고, 이에 따라 산업계와 학계가 연계하여 데이터 분석을 잘 할 수 있도록 할 필요성이 있음을 연설하였다. 또한 빅데이터에서 자주 쓰이는 3V(Volume, Velocity, Variety)의 패러다임이 바뀌어야 하고, 데이터를 통해 가치, 즉 Value를 창출할 수 있도록 해야함을 명시하였다.

2, Keynote 연사로 오라클 Kenneth Chang 전무, SAS 이진권 상무, 한국EMC 이달수 상무 세 명이 각각 연설을 진행하였다. 빅데이터 시대에 분석을 어떻게 해야하며, 분석을 잘 하는 것의 중요성을 언급하였다. 아래는 연설에서 중요하다고 생각되는 내용이다.

 * 수 년 이내로 데이터는 지금의 50배 가까이 증가를 할 것이고, 그 중 대다수는 Social 데이터, 비정형 데이터로 예측이 된다. 따라서 비정형 데이터를 구조화하여 기존의 숫자 데이터와 함께 다변량 데이터로써 한꺼번에 처리하는 것이 필요하다.

 * 과거 데이터도 현재 가지고있는 데이터와 Tool을 이용하여 분석을 하면 새로운 결과를 창출할 수 있다.

 * 빅데이터 혁신의 7가지 추진 포인트

(1) 주제를 선정하라 : 특별한 것을 찾으려 하기 보다는 지금 하고 있는 업무를 구체적으로 돌아보아라. 그러면 빅데이터를 통해 분석해야될 것이 보일 것이다.

(2) 데이터를 준비하라 : 분석가 입장에서 데이터를 정의하고, 관리자 입장에서 데이터를 수집, 저장하라.

(3) 현상과 변화를 감지하라 : 복잡한 빅데이터 분석에 앞서 시계열/추이 분석 등을 통해 현상을 이해하고 변화를 확인하여라.

(4) 변화의 원인을 찾아라 : 다양한 기법을 활용하라. 이를 활용하고 시도할 수 있는 분석의 장을 마련하여라.

(5) 예측/최적화 모델로 진화시켜라 : 끊임없이 새로운 데이터와 분석기법을 모색하고, 그 기법을 통해 모델링 하여라.

(6) 데이터 과학자를 지향하라 : 데이터를 획득, 정리, 조사, 계량화, 해석할 수 있는 데이터 과학자를 장기적으로 양성하여라.

(7) 제대로 된 솔루션을 준비하라 : 빅데이터는 한 번의 프로젝트로 완성되는 것이 아니라 지속적으로 진화하는 비즈니스 자체이다. 처음부터 제대로 된 솔루션의 구축이 필요하다.

회사에 몸을 담고 있으신 분들이다 보니 결과적으로는 회사를 홍보하는 것으로 마무리가 되어 그 부분은 안타깝긴 하였으나, 현재 현업에서 데이터 분석을 어떻게 하고 있는지 확인할 수 있는 기회가 되었기 때문에 좋은 경험을 했다고 생각한다.


- 오후 세션 : BI 춘계학술대회


1. 모바일/스마트디바이스 기반 데이터마이닝 응용에 대해 서울대, 연세대에서 발표하였다.

서울대에서는 스마트 디바이스에 저장되는 위치 로그를 이용하여 개인별 주요 장소를 클러스터링을 이용하여 만들고자 하였다. 실시간으로 정보를 바로 활용하려면 추가 연구는 필요할 것으로 보이나 기본적인 시도 자체는 좋았고, 추후 연구 결과를 기대할 만하다.

연세대에서는 베이지안 네트워크를 이용하여 로그를 저전력으로 추출하는 것을 주제로 삼았고, 기존의 방법보다는 정확도가 떨어지나 전력 소모는 50%이하로 줄어들게 됨을 확인하였다. 그러나 기존 방법 자체가 저전력 방식으로 개선이 된다면 연구의 결과가 달라지지 않을까 생각해보았다.


2. 최적화 기법 및 응용에 대해 아주대 두 팀, 그리고 손지은 연구원이 발표하였다.

아주대 1팀에서는 신재생에너지 발전원, 에너지 저장장치를 어떻게 조합할 것인지에 대해 최적화 모형을 이용하여 풀어내었다. 최근에 원자력 발전소 문제와 여름철 전력 부족 사태가 잇따라 발생하고 있는데, 이에 대해 해결방안을 제시하고자 하였고, 사실 일부 결과에 대해서는 의미가 있는가에 대해 의구심이 들었으나 전반적으로는 올바르게 서술하였다. 또한 경제성 분석을 통해 결과가 경제적으로 유효한가에 대해서 서술한 것은 흥미로웠다.

아주대 2팀에서는 대기업 순환출자 해소를 위한 최적화 모형을 제시하였다. 기본적으로 기업이 순환출자를 없애야 하는 것에 메리트가 더 필요하다는 것이 개인적인 의견이지만, 추후 사회가 변하게 되어 기업에서 순환출자를 해소해야 되는 상황이 발생한다면 유용하겠다고 생각하였다. 결과에서 적은 양의 변화로 순환출자를 없애고 기업의 손실을 최소화할 수 있다는 것은 인상깊었다.

손지은 연구원의 발표는 이전 세미나때와 비교하여 괜찮았다고 생각하였다. 내용에 대해 오류 없이 논리적으로 구성하였고, 청중이 잘 들을 수 있는 수준으로 발표가 진행되었다. 아쉬운 점은 앞선 두 팀이 발표시간을 예정보다 길게 가져가 발표 내용에 대한 질문을 들을 수 없었다는 것이다. 참석자들의 기탄 없는 의견을 들을 기회가 없어서 안타까웠다.

3. 데이터마이닝 모델링에 대해 조수곤 연구원, 경기대 박천건 교수님이 발표하였다.

조수곤 연구원의 발표는 앞선 발표들에 비해 안정감있고 원활하게 진행되어서 청중이 듣기에 좋았을 것이라 생각된다. 인상깊었던 점은, 발표 내용에 대해 다수의 질문이 나오게 되었는데, 이에 대해 당황하지 않고 유도리 있게 답변을 하였다는 것이다. 개인적으로 본받아야할 점이라 생각한다.

경기대 박천건 교수님은 다변량 회귀분석에서 이상치 탐지 방법에 대해서 발표하였는데, 일반적으로는 Unbiased Estimator를 사용하는 것에 반해 Biased Estimator를 채택하여 활용하였다는 점 자체가 매우 재미있었다. 비슷한 종류의 Unbiased Estimator를 이용하였을 때 결과가 어떻게 되는지에 대해 궁금하다.

4. 초청강연으로 빅데이터와 개인정보보호라는 주제로 연세대학교 이원석 교수님이 연설하였다. 현재 빅데이터에서 정보보호 이슈 때문에 이에 대해 어떻게 받아들여야 하는지가 주된 내용이었는데, 개인정보보호가 빅데이터 시장에서 어떠한 영향을 미치게 되는 지에 대해 새롭게 알게 된 점이 좋았다고 할 수 있다. 앞으로 웹 크롤링을 할 때 정보보호에 대한 이슈에 대해 심도있게 고려해봐야되겠다.