고려대학교 DMQA 연구실

2015 ICIEA 학회 - 김영훈

2015년 5월 25일 오후 5:31
조회수: 1471

Reviewed by

김영훈

[발표 후기]

발표 주제 : One-Class Classification by Local Target Selection

발표 Summary

정수 계획법을 활용해서 Convex Optimization 기반의 Support Vector Data Description이 가지고 있던 한계점을 극복한 Local Target Selection에 대해서 발표를 했다. 이전의 SVDD에서는 Target이 되는 데이터들의 비율을 정확하게 정하는 것이 이론적으로 불가능했고, 특정한 데이터 포인트를 선택 또는 선택하지 않는 식의 논리적인 모델 구성도 불가능했다. 하지만 Quadratic Programming과 Integer Programming을 혼합해서 우리가 만든 LTS는 Decision Boundary 안에 원하는 개수 만큼의 Target 데이터를 포함할 수 있고, 추가적으로 다양한 논리를 표현할 수 있는 확장성을 갖는다. 이러한 확장성을 통해 앞으로 과거 Convex Optimization으로 해결될 수 없었던 많은 문제들을 찾고, 해결하는 연구를 진행하려고 한다.

세션 질문

Q1. 이러한 방법론이 어디에 응용될 수 있는가?

답변 : 품질관리 분야에서 정상과 이상을 구분하는 문제나 인터넷 보안 쪽에서 망침입 발견과 같은 부분에 응용될 수 있다. 또한 바이오 데이터를 모니터링해서 이상 상태를 알려주는 분야에도 사용될 수 있다.

발표 후기

영어 발표를 처음 진행하는 것이 아니었음에도 불구하고, 많이 긴장되서 생각대로 진행되지 않았던 부분들이 있었다. 이러한 부분들을 연습을 좀 더 많이 했어야 했는데 그러지 못했던 것이 아쉽고, 다음에는 발표가 어려운 슬라이드와 쉬운 슬라이드를 잘 구분해서 어려운 슬라이드들을 중점적으로 좀 더 많은 연습을 하는 것이 좋을 것 같다. 그리고 발표 외에도 질문에 대해서도 미리 예상 질문을 뽑아서 답변을 만들어보고 연습을 해두면 좀 더 자연스럽게 답변을 할 수 있을 것 같다. 여러 모로 배운 점이 많았던 학회 발표였다.

[청취 후기]

1. Keynote Session

기조 강연에서는 총 세 분의 교수님들께서 발표를 진행하셨는데, 그 중에서 Yang Xiao 교수님과 Girija Chetty 교수님의 발표를 인상깊게 들었다. 먼저 Yang Xiao 교수님은 로그 데이터를 처리하는 새로운 방법론에 대해서 강연을 하셨다. 기존의 로그 데이터들을 발생한 순서대로 무질서하게 데이터 베이스에 저장되어있기 일수였다. 그래서 정작 중요한 정보를 찾으려면 방대한 데이터 베이스 상에서 무엇을 분석해야 하는지, 어떤 원인이 있었기에 이와 같은 일들이 일어났는지 일일이 되짚어봐야 했다. 하지만 로그를 적재하는 과정에서 서로 관련이 있는 로그들을 하나의 노드로 보고, 에지로 연결하는 그래프를 만들면 어떠한 사건들이 일어났을 때 문제의 원인은 무엇인지 관련된 로그는 무엇인지 매우 빠르게 파악할 수 있다. 이러한 아이디어를 확장해서 다양한 데이터 베이스에 적용하는 연구를 하고 있었는데 빅데이터 시대에 중요하고, 의미있는 연구라 생각이 되었다. 그래프로 데이터를 표현하는 것에 다양한 장점들이 있는데, 시계열 데이터에서도 의미있는 사례를 배운 것 같아 공부가 많이 되었다.

다음으로는 Girija Chetty 교수님의 강의가 인상깊었다. 주제는 Censor Fusion에 관한 것이었는데, 처음 제목을 접했을 때는 물리적인 Censor를 혼합하는 연구를 하시는 분인 줄 알았는데, 그것은 아니었고 데이터 상에서의 Fusion을 연구하시는 분이었다. 우리 연구 분야와도 연관이 많아 친숙했고, 좋은 내용들이 많아서 재미있게 들었다. Censor Fusion이라고 하는 것은 간단히 정리하면 다양한 Censor Data를 하나로 결합시켜서 데이터를 분석하는 방법론을 의미한다. 소리, 이미지, 텍스트 등의 데이터를 각각의 범주 안에서 구분해서 분석하는 것이 아니라, 모든 것들을 다 합쳐서 하나의 데이터로 만들고 PCA나 LDA와 같은 방법을 통해 변수를 추출한 후 분류나 예측을하는 방법이다. 개념 자체는 어렵지 않았지만 굉장히 신선했고, 현재 대부분의 AI 연구가 특정 데이터 형태에 초점이 맞춰져 있는 형태기 때문에 여기서 좀 더 발전할 수 있는 교두보가 되는 아이디어인 것 같다. AI의 최종 목표가 되는 사람의 경우에도 다양한 감각 기관의 신호들을 종합해서 인지 판단을 하게 되는데, 컴퓨터의 경우에도 다양한 정보를 종합할 수 있다면 지금보다 더 좋은 기능들이 AI로 구현될 수 있지 않을까 생각이 들었다. 다양한 데이터의 융합에 대해서 좀 더 고민해 보면 좋을 것 같다.

2. Analysis Electromyography on Computer Interaction Devices to the Riska of Carpal Tunnel Syndrome

터널 증후군은 고정된 자세로 장시간 컴퓨터 인터페이스 장치들을 이용하는 사람들에게 많이 나타나는 증후군이다. 특히 게임을 하는 사람들에게 많이 나타나는데, 필자들은 어떠한 장치를 사용했을 때 가장 위험도가 높아지는 지를 근육 경직도에 따라 달라지는 시그널 데이터를 통해 분석했다. 손과 팔에 있는 근육들 중 터널 증후군에 영향을 많이 주는 근육을 정하고 그 부분들에 센서를 부착한 후 각 디바이스 (키보드, 마우스, 조이스틱)에 따른 증후군 발생 위험도를 측정하였다. 시그널 데이터를 통해서 Anova 분석과 비모수 통계를 이용해서 어떤 디바이스가 가장 위험한 지 통계적으로 밝혀내었다. 사실 아주 어려운 이론이나 방법론이 사용되지는 않았지만 주제 자체가 의미가 크다고 생각했고, 데이터를 직접 만들어서 분석까지 하는 전 과정을 계획하고 진행했다는 점에서 배울 점이 많았다. 현재 나 같은 경우 다양한 산업 현장에서 미리 계측된 데이터를 분석하는 작업을 하고 있기 때문에 어떻게 데이터를 만들어야 유의미한 정보를 뽑아낼 수 있고, 더 정확하게 분류나 예측을 할 수 있을지에 대한 생각은 많이 못하고 있었다. 그런데 이 발표를 통해서 그러한 생각들도 조금씩 해보는 것도 큰 공부가 될 것이라 생각이 되었고, 현재 진행하고 있는 프로젝트를 통해 직접 실천해보고 공부해봐야 겠다라는 생각이 들었다.

Conference