- 2014년 6월 1일 오후 10:24
- 조회수: 1323
이한규
지난 금요일 (14,5,30)에 양재동에 있는 엘타워에서 R user conference가 열렸었다.
평일 오전세션임에도 불구하고 첫번째 개회사부터 약 350명 정도의
인원이 발표장을 가득 메우고 있었고 오후세션때는 모든 세션들이 빼곡히 서서 볼정도로 많은 인원이 참가했었다. 또한
다양한 직업에서 많은 사람들이 현업에서 R을 사용한다는 점에서 R의
인기를 실감할 수 있었다. 오전세션은 R의 강점/약점등 R을 소개하는 프로그램 위주로 진행이 되었으며 오후세션은 직접 R을 활용한 다양한 응용사례 위주로 프로그램이 진행되었다.
특히 오후세션중에서 Operationalisation of machine
learning techniques란 주제로 호주 이민국에서 근무하고 계신분의 발표가 인상깊었다. 발표내용을
간략하게 정리하자면, 호주 이민국에서는 출입국 과정에서 위험인물 및 테러의심인물을 프로파일 정보만을
사용하여 검사하는 업무를 하고있다. 이 과정에서 업무의 효율성을 증진시키고자 기존의 machine learning 기법을 활용하였고, 실제로 업무에 적용하여
상당한 금전적, 시간적인 이득을 취했다는 내용이다.
공공데이터를 분석주제로 잡고 있는 입장에서 첫째로, 정부 산하 기관에서
직접적으로 데이터마이닝을 활용하였고, 이를통해 process상에서
상당한 개선을 했다는점 둘째로, 일반적으로 공공데이터라고 하면 분석을 목적으로 생성된 데이터가 아니기
때문에 이를 다루는데 있어 상당한 어려움이 있는데 이와 같은 공공데이터를 사용했다는 점 그리고 마지막으로 복잡한 알고리즘, 방법론이 아닌 비교적 간단한 알고리즘을 통해서 위와 같은 시스템을 개발했다는 점에서 흥미있는 발표였다.
추가적으로 이번 conference를 통해 느낀점은 요즘과 같은 빅데이터
시대에 데이터 과학자로써,모델을 구성하고 분석 및 해석하는 능력도 중요하지만, 날로 거대해지는 방대한양의 데이터를 다루는 능력 또한 상당히 중요한 능력이라는 생각이 들었다.