- 2013년 12월 9일 오후 1:29
- 조회수: 855
강지훈
1. 발표준비과정
- 새로운 연구주제를 준비하는 과정에서 1) 문제 상황 정의 2) 기존 연구에 대한 조사 3) 시뮬레이션 수행 및 결과 검증 4) case study로 현실 문제에 적용하는 순서로 준비하였음
- 연구 특성 상, literature review의 중요성이 판단되어, 기존의 연구 논문들에 대하여 정리하고 특징 적인 부분들을 논리적 순서에 맞게 구성하는 것을 중점적으로 발표 준비함
2. 발표 시 아쉬웠던 점과 개선 방향
아쉬운 점
- 장표 자체가 다수의 슬라이드로 구성(34장)되어 한정된 시간 내에 정보 전달을 효율적으로 하기에는 무리가 있었음
- 슬라이드 한장에 알리고자 하는 내용이 너무 많은 경향이 있어 청자들로 하여금 핵심 파악이 힘들었던 것 같음
- 시뮬레이션 및 case study 부분에 대한 설명이 부족함 (실험 결과들이 갖는 insight에 대해서 제대로 전달하지 못함)
개선 방향
- 좀 더 불 필요한 내용들을 빼고 핵심적인 내용을 위주로 요약하여 20~25이내로 요약할 필요가 있음. 예를 들어 시뮬레이션과 결과부분은 같은 내용이 반복되는 경향이 있어 혼돈을 줄 여지가 있고 핵심이 흐려질 우려가 있음.
- 글로 서술한 내용 보다는 본질적인 의의와 그림을 통한 insight를 표현하는 방식을 활용하는 것이 더 유용할 듯함.
- 실험결과를 요약할 수 있는 그래프를 삽입하는 것이 전체적인 성능 비교를 표현하는데 더 효과적일 것이라 판단됨.
3. 발표 후 나온 질문 목록과 답변 평가
질문 1. 정상 데이터가 nonparametric 할 경우의 파생되는 문제를 해결하고자 연구를 진행하였는데 T2 관리도를 사용한 것은 여전히 parametric한 한계점 (즉, 정상분포가 nonnormal 일 경우, FAC의 성능이 보장되지 못하는 등의 문제) 을 갖고 있는 것은 아닌지?
대답 : FAC가 nonparametric 관리도의 효과를 내는 부분은 classification 알고리즘을 적용하여 정상과 이상분포를 효과적으로 분별함으로써 데이터의 사전분포에 상관없이 활용가능 하다 (-> 잘못된 대답 : 질문자의 의도는 정상 분포의 parametric 가정에서 오는 한계점을 물어본 것임)
개선된 대답 : Bootstrap T2 관리도를 활용함으로써 parametric 추정에서 오는 한계점을 극복 하였음. 그리고 연구의 핵심은 관리도를 이용하여 정상분포의 다수를 걷어내고 정상과 이상의 분포가 오버랩된 데이터들을 잘 분리하는 것을 목적으로 하기 때문에 실상 중간과정에는 어떠한 관리도든 (ex. SVDD 기반 관리도 등) 활용 가능하다는 것을 어필해야 함.
질문 2. 정상과 이상의 class imbalance 문제를 해결하는 장점을 지니고 있다고 하였는데 false alarm classification 로직을 통해 반대 상황, 즉 이상 관측치는 많고 정상 관측치는 적은 상황이 생길 수는 없는지?
대답 : 데이터의 정상(false alarm)/이상(true alarm) imbalance를 조정하는 형태로 FAC training set을 조정 가능하다고 응답. (-> 구체적인 방법을 언급 못함)
개선된 대답 : Phase I 단계에서 정상과 이상 class의 balance가 맞도록 type I error를 조정 가능하기 때문(bootstrap T2를 활용하기에 false alarm 데이터는 우리가 설정한 α에 맞게 나타남)에 이상이 극단적으로 많고 정상이 적은 상황을 예방할 수 있다고 설명 해야 함.
제언 1. T2와 Decision Tree가 아닌 성능 좋은 OCC 기법과 classification algorithm을 활용해보면 어떨지 ?
대답 : 현재 그 분야에 대해서 연구중 이며 여러가지 관리도와 classification algorithm을 접합한 기법에 대해 비교 분석할 예정임.