- 2015년 11월 10일 오후 5:41
- 조회수: 1653
정영재
<발표 후기>
제목: Parameter-Less Self Organizing Map based Control Chart
본 연구는 2가지 문제를 풀었다. 데이터가 정규분포를 따르지 않는 비정규성,비선형성과 데이터의 분포 또는 모수가 시간에 따라 변화하는 시간변동성 문제이다. 이전에 이러한 문제를 해결한 연구로는 2012년에 중국의 Xie가 연구한 Time-Adaptive GMM(TAGMM)이 있다. 데이터를 여러개의 정규분포로 설명하는 방법이 GMM방법인데, TAGMM은 GMM을 시간변동성 문제에 적용한 것이기 때문에 비정규성,비선형성을 띄는 데이터에 대하여 정교한 관리가 이루어지지 못한다는 단점이 있다. 따라서 본 연구에서는 비정규성, 비선형성 데이터를 잘 설명할 수 있는 Self Organizing Map(SOM)을 사용하여 비정규성, 비선형성 문제를 해결하였고, 또한 Parameter-Less Self Organizing Map(PLSOM)이라는 시간변동성을 해결할 수 있는 SOM방법을 사용하여 시간변동성 문제를 해결하였다. 추후 연구로는 SOM의 파라메터가 결과에 어떠한 영향을 주는지에 대한 것과 제2종 오류에 대한 실험을 하면 좋을 듯 하다.
질의응답
Q1. Parameter-Less Self Organizing Map based Control Chart라는 제목을 붙였는데, Parameter-Less인 이유는 무엇인가?
답변 : 시간변동성을 해결할 수 있는 방법으로 SOM의 변형방법인 Parameter-Less SOM이란 방법을 사용하였기 때문에 제목을 그렇게 붙였습니다. 이 방법이 이러한 이름을 가지고 있는 이유는 이 방법의 다른 특성으로 SOM에 있는 4개의 파라메터를 1개로 줄였다는 점이 있기때문입니다.
Q2. 정상변동뿐만 아닌, 이상변동을 정상으로 인식하여 관리도가 업데이트 되는 문제도 있지 않은가?
답변 : 비교연구가 된 Xie의 TAGMM의 경우, 정상변동을 0.003 이상변동을 1로 설정하여 실험을 하였습니다. 이 이유는 정상변동과 이상변동은 큰 차이가 있다는 가정이 있기 때문입니다. 본 연구도 위와 같이 정상변동과 이상변동 영역에는 차이가 있다는 가정을 하였고, 실제문제에서도 차이가 있기 때문에 문제가 없을 것으로 생각합니다.
<청취 후기>
발표자로서 학회참가는 처음이였고, 그래서인지 다른 발표자들이 어떻게 발표를 진행하는지 유심히 지켜보았다. 여러대학에서 온 발표자들의 흥미로운 연구들을 보아서 좋았고, 발표를 보면서 느낀 점은 전문용어를 너무 많이 사용한다는 점이다. 나 또한 전공자이지만 모든 내용을 알지 못하므로 전문용어를 덜 사용하여 이해를 쉽게해주기를 바랬기 때문에 이 점이 아쉬웠다. 타산지석으로 삼아 나도 발표시 전문용어를 최대한 풀어서 설명해여 이해를 도와야겠다고 생각했다. 그 외 흥미롭게 들었던 발표는 다음과 같다.
1. A New Feature Ranking Method using a Markov Blanket for Gene Selection
제안하는 방법은 Markov Blanket이라는 방법을 응용하여 Gene 데이터에 변수 선택을 하는 방법이다. Gene 데이터는 변수의 개수가 관측치의 개수보다 많은 특성을 가지고 있는데, 많은 변수 중 중요변수를 선택하는 것은 향후 분석과 해석에 중요하다. Markov Blanket이란 방법에 익숙하지 않아 전체적인 내용을 이해하지는 못했지만, 이러한 개념이 있다는 것을 알 수 있었고, 연구실험결과가 매우 좋게나와서 흥미로웠다.
2. A Novel Method to Build Logistic Regression Trees for Categorical-Numeric Mixed Type Data Classification
본 연구는 의사결정나무를 실행한 후, 각 마지막 노드에 속하는 데이터에 대하여 각각 Group Lasso Logistic Regression을 실행하는 방법으로 범주형 변수와 숫자형 변수에 대하여 모두 사용할 수 있는 장점이 있다. 의사결정나무 의 마지막 노드에 속하는 데이터별로 모델을 적합시키므로 과적합의 문제가 발생할 수 있는데, 이를 Lasso Logistic Regression의 일반화하는 성능이 보완하였다. 각 방법의 장단점을 잘 연결하려고 시도했다는 점이 흥미로웠다.