2014 한국BI데이터마이닝학회 추계 학술대회 - 최우식
- 2014년 12월 1일 오후 2:56
- 조회수: 1233
Reviewed by
최우식
최우식
11월 28~29일 양일간 개최된 한국BI데이터마이닝학회에 참여하였다. 현재 본인이 연구하고 있는 분야가 어떻게 활용되고 있는지, 또한 다른 데이터마이닝 분야는 어떤 것들이 연구가 되는지를 확인할 수 있었던 유익한 시간이었다고 생각하였다. 몇 가지 기억에 남는 발표에 대해 요약을 하면 다음과 같다.
1. Location, Mobility and Link Analyses of the Geotagged Tweets (세션 : SNS, Network and TEXT Mining data analysis)
주로 트위터 분석에 관한 내용이었으나, 트위터에 Geotagged 된 즉, 위치 정보가 기록이 되어있는 트위터를 분석하였다. 이를 통해 어느 장소에서 트위터가 많이 발생하는 지, 또한 장소에 따라 등장하는 언어가 어떻게 차이가 나는 지 확인할 수 있었고, 또한 트위터를 통해 국가 간 연결 정도를 확인할 수 있는 가능성을 볼 수 있었다. 한 가지 아쉬운 점이 있다면, 한국의 경우 한국어 자체가 가지고 있는 분석의 어려움, 한국어 사용 인구의 부족, 위치 정보 사용 인원의 부족 등의 문제를 가지고 있기 때문도 있기는 하지만, 국내 결과에 대해 쉽게 납득하기 어려운 정보가 도출 되는 등 그 근거가 부족해보였다. 이에 대해서는 앞으로 국내에서 위치 정보 활용에 대해 사람들이 어떤 마인드를 가지게 되냐에 따라 크게 달라질 것이라 보고, 그 때 까지 여러 연구 결과들을 지켜봐야겠다고 생각하였다.
2. 이종분야 간 기술속성 유사도에 기반한 신기술 아이디어 창출 방법론 특허정보의 텍스트마이닝 적용 (세션 : SNS, Network and TEXT Mining data analysis)
텍스트마이닝을 통해 특허의 분야별 기술속성을 이용하여 새로운 특허를 생성하는 것에 대해 발표하였다. 기본적으로 결과와 상관없이 아이디어에 가산점을 주고 싶지만, 현재 발표자의 연구 진행 상황으로 보았을 때는 아직까지 미진한 부분이 다수 발견되었다. 일단 기본적으로 분야가 유사하고 어떤 기술이 쓰이면 좋을 것 같아 보일 수는 있어도 그 기술을 바로 도입할 수 있을 것이라는 보장을 할 수 없는데, 법적, 사회적 문제로 분야마다 세부적으로 고려해야 되는 사항이 많기 때문이다. 또한 텍스트의 내용에 대해 심층적인 분석을 한 것이 아니라 유사도만을 기반으로 하였기 때문에 직관적으로도 쓸모없는 내용이 추천될 수 있을 것으로 보였다. 그러나 이러한 다양한 변수들을 고려할 수 있도록 하게 된다면 이는 국가 차원에서도 도움이 될 수 있는 연구라 생각하며, 앞으로의 연구 성과도 기대해볼 수 있겠다.
1. Location, Mobility and Link Analyses of the Geotagged Tweets (세션 : SNS, Network and TEXT Mining data analysis)
주로 트위터 분석에 관한 내용이었으나, 트위터에 Geotagged 된 즉, 위치 정보가 기록이 되어있는 트위터를 분석하였다. 이를 통해 어느 장소에서 트위터가 많이 발생하는 지, 또한 장소에 따라 등장하는 언어가 어떻게 차이가 나는 지 확인할 수 있었고, 또한 트위터를 통해 국가 간 연결 정도를 확인할 수 있는 가능성을 볼 수 있었다. 한 가지 아쉬운 점이 있다면, 한국의 경우 한국어 자체가 가지고 있는 분석의 어려움, 한국어 사용 인구의 부족, 위치 정보 사용 인원의 부족 등의 문제를 가지고 있기 때문도 있기는 하지만, 국내 결과에 대해 쉽게 납득하기 어려운 정보가 도출 되는 등 그 근거가 부족해보였다. 이에 대해서는 앞으로 국내에서 위치 정보 활용에 대해 사람들이 어떤 마인드를 가지게 되냐에 따라 크게 달라질 것이라 보고, 그 때 까지 여러 연구 결과들을 지켜봐야겠다고 생각하였다.
2. 이종분야 간 기술속성 유사도에 기반한 신기술 아이디어 창출 방법론 특허정보의 텍스트마이닝 적용 (세션 : SNS, Network and TEXT Mining data analysis)
텍스트마이닝을 통해 특허의 분야별 기술속성을 이용하여 새로운 특허를 생성하는 것에 대해 발표하였다. 기본적으로 결과와 상관없이 아이디어에 가산점을 주고 싶지만, 현재 발표자의 연구 진행 상황으로 보았을 때는 아직까지 미진한 부분이 다수 발견되었다. 일단 기본적으로 분야가 유사하고 어떤 기술이 쓰이면 좋을 것 같아 보일 수는 있어도 그 기술을 바로 도입할 수 있을 것이라는 보장을 할 수 없는데, 법적, 사회적 문제로 분야마다 세부적으로 고려해야 되는 사항이 많기 때문이다. 또한 텍스트의 내용에 대해 심층적인 분석을 한 것이 아니라 유사도만을 기반으로 하였기 때문에 직관적으로도 쓸모없는 내용이 추천될 수 있을 것으로 보였다. 그러나 이러한 다양한 변수들을 고려할 수 있도록 하게 된다면 이는 국가 차원에서도 도움이 될 수 있는 연구라 생각하며, 앞으로의 연구 성과도 기대해볼 수 있겠다.