2015년 대한산업공학학회 춘계학술대회 - 유화윤
- 2015년 4월 13일 오후 6:05
- 조회수: 1633
Reviewed by
유화윤
유화윤
-발표 후기-
[발표 후기]
이틀중 둘째날 발표여서 첫날은 여유있게 다른 발표를 여유있게 들을 수 있었는데, 다른사람들의 발표를 들을때마다 내 자신이 작아지는 것을 느꼈다. 연구란 심오하고 복잡하고 어려운 것을 해내는 것이고 이 사람들은 그런것을 했는데, 내가 한것은 너무 하찮은게 아닌가.. 하는 생각에 발표하는것이 부끄러워졌다. 그렇지만 그날 밤 다함께 담소를 나눌때 교수님과 동료들이 조언을 해주어 자신감을 되찾았다. "내 연구에대해선 내가 제일 잘 안는 것이니 두려울것 없다, 내 연구에 대해 많이 공부했기때문에 하찮게도 보일 수 있는것이다." 라는 말에 힘입어 당당하게 발표 할 수 있었다. 발표에 대해서는 대체로 매끄러웠다고 생각된다. 그러나 주어진 시간에 비해 슬라이드가 적었는데 말이 좀 빨라서 일찍 끝났던것 같고, 내용 자체가 얕았던 것이 가장 아쉽다. 다음에는 적용한 데이터마이닝 기법에 대한 설명과 예측 결과를 해석한 슬라이드를 추가하고 좀 더 차분히 발표 해야겠다.
[발표 후 질의응답]
LG 디스플레이 참석자로 부터 3가지 질문을 받았다.
[질문1]
Q : 예측 Error는 6개월 고객불량율과 예측 고객불량율을 비교한 것인가?
A : 보증기간 종료시점의 고객불량율 데이터가 있어서, Training과 Test로 나누었고 Error는 Test 데이터의 예측값과 실제값의 차이다.
[질문2]
Q : 가속 수명 평가를 하는데 가속 수명 평가결과로 예측한것과 본인의 연구결과를 비교해봤는가 ?
A : 회사에서 가속 수명 평가를 하지만, 불량이 날때까지 평가하는것이 아니라 일정시간(대략500시간) 평가해서 문제가 없으면 Qual하는 방식이기때문에 시간에 따른 불량 발생 데이터가 없다. 따라서 그 평가 데이터로 예측하긴 어렵다.
Q : 하지만, 가속수명 평가를 하긴하므로 그 것을 사용하고 비교해보는게 의미가 있겠다.
→ 반입시점기준 고객불량률 데이터를 고장시점에 반입된 것이라 가정하고, Weibull 분포로 예측해서 실제값과 Error차이를 확인하는 것이 의미있을 것같다. Weibull 분포를 따른다면, 즉 Error가 작다면 Weibull 분포를 이용해서 예측하는 방법을 고민해봐야겠다.
[질문3]
Q : 모델정보가 무엇인가 ?
A : 모델 기술에 관련된 정보이다.구체적으로 말씀드리긴 어렵다.
Q : Architecture에 관한 것인가?
A : 그것은 아니고, 해상도와 같은 비교적 단순한 정보들이다.
-청취 후기-
빅데이터 워킹세션에서 2가지 발표를 인상깊게 들어서 적어본다.
[다중 센서 시그널의 상호전개관계를 고려한 주성분분석과 반도체공정 온라인 모니터링으로의 응용-이기범, 김창욱(연세대학교)]
학교에 입학이래로 반도체 공정 모니터링은 다변량 데이터마이닝으로만 가능한 것으로 생각했었다. 그러나 주성분 분석을 통해 주요 변수를 선택하고 벡터방향으로 더영향력 있는 변수를 찾을 수 있다는것을 새삼 알게되었다.
그리고, 다변량과 시계열이 갖이 있는 경우, 시계열 분석이 어려워서 다변량 분석을 해야하는 줄 알았는데, 3way 데이터라고 명명하고 분석하는 방법이 별도로 있다는 것을 알았다. 내가 연구하는 데이터도 다변량과 시계열이 공존하므로 데이터마이닝 적용에 그치지말고, 3way 데이터 분석방법을 찾아봐야겠다.
[A modified Adaboost with SVM for relaxing class imbalance problem -이원지, 전치혁(POSTECH) 이기범, 김창욱(연세대학교)]
Class 불균형 문제가 근본적으로 무엇이 문제이고 어떻게 접근해야 하는지 잘 설명해 준 것 같다. 서로다른 class가 단순히 overlap
된 것이 문제인게 아니라, class가 구분되야하는 경계영역에서 overlap된 것이 문제라는 말에 공감되었다. 따라서, 이분야를 연구한
다면, 전체 데이터의 불균형 문제를 해결하는 것보다 경계영역의 불균형에 대해서 집중하는게 좋은 방향이라고 생각된다.
별도로, 이번 학회에서 빅데이터 또는 비즈니스 애널리틱스 분야의 발표가 많은 비중을 차지한 것 같다. 특히 텍스트 마이닝 발표가 많았고 이중에서도 한글을 어떻게 분석할 것인가에 대한 내용이 많았다. 이렇게 핫 한 텍스트 마이닝에 대해 이번 학기에 제대로 배울수 있는 수업(비정형 데이터 분석)이 생겨서 좋은것 같고, 이 수업의 프로젝트가 다소 어렵지만 열심히 해야겠다.
[발표 후기]
이틀중 둘째날 발표여서 첫날은 여유있게 다른 발표를 여유있게 들을 수 있었는데, 다른사람들의 발표를 들을때마다 내 자신이 작아지는 것을 느꼈다. 연구란 심오하고 복잡하고 어려운 것을 해내는 것이고 이 사람들은 그런것을 했는데, 내가 한것은 너무 하찮은게 아닌가.. 하는 생각에 발표하는것이 부끄러워졌다. 그렇지만 그날 밤 다함께 담소를 나눌때 교수님과 동료들이 조언을 해주어 자신감을 되찾았다. "내 연구에대해선 내가 제일 잘 안는 것이니 두려울것 없다, 내 연구에 대해 많이 공부했기때문에 하찮게도 보일 수 있는것이다." 라는 말에 힘입어 당당하게 발표 할 수 있었다. 발표에 대해서는 대체로 매끄러웠다고 생각된다. 그러나 주어진 시간에 비해 슬라이드가 적었는데 말이 좀 빨라서 일찍 끝났던것 같고, 내용 자체가 얕았던 것이 가장 아쉽다. 다음에는 적용한 데이터마이닝 기법에 대한 설명과 예측 결과를 해석한 슬라이드를 추가하고 좀 더 차분히 발표 해야겠다.
[발표 후 질의응답]
LG 디스플레이 참석자로 부터 3가지 질문을 받았다.
[질문1]
Q : 예측 Error는 6개월 고객불량율과 예측 고객불량율을 비교한 것인가?
A : 보증기간 종료시점의 고객불량율 데이터가 있어서, Training과 Test로 나누었고 Error는 Test 데이터의 예측값과 실제값의 차이다.
[질문2]
Q : 가속 수명 평가를 하는데 가속 수명 평가결과로 예측한것과 본인의 연구결과를 비교해봤는가 ?
A : 회사에서 가속 수명 평가를 하지만, 불량이 날때까지 평가하는것이 아니라 일정시간(대략500시간) 평가해서 문제가 없으면 Qual하는 방식이기때문에 시간에 따른 불량 발생 데이터가 없다. 따라서 그 평가 데이터로 예측하긴 어렵다.
Q : 하지만, 가속수명 평가를 하긴하므로 그 것을 사용하고 비교해보는게 의미가 있겠다.
→ 반입시점기준 고객불량률 데이터를 고장시점에 반입된 것이라 가정하고, Weibull 분포로 예측해서 실제값과 Error차이를 확인하는 것이 의미있을 것같다. Weibull 분포를 따른다면, 즉 Error가 작다면 Weibull 분포를 이용해서 예측하는 방법을 고민해봐야겠다.
[질문3]
Q : 모델정보가 무엇인가 ?
A : 모델 기술에 관련된 정보이다.구체적으로 말씀드리긴 어렵다.
Q : Architecture에 관한 것인가?
A : 그것은 아니고, 해상도와 같은 비교적 단순한 정보들이다.
-청취 후기-
빅데이터 워킹세션에서 2가지 발표를 인상깊게 들어서 적어본다.
[다중 센서 시그널의 상호전개관계를 고려한 주성분분석과 반도체공정 온라인 모니터링으로의 응용-이기범, 김창욱(연세대학교)]
학교에 입학이래로 반도체 공정 모니터링은 다변량 데이터마이닝으로만 가능한 것으로 생각했었다. 그러나 주성분 분석을 통해 주요 변수를 선택하고 벡터방향으로 더영향력 있는 변수를 찾을 수 있다는것을 새삼 알게되었다.
그리고, 다변량과 시계열이 갖이 있는 경우, 시계열 분석이 어려워서 다변량 분석을 해야하는 줄 알았는데, 3way 데이터라고 명명하고 분석하는 방법이 별도로 있다는 것을 알았다. 내가 연구하는 데이터도 다변량과 시계열이 공존하므로 데이터마이닝 적용에 그치지말고, 3way 데이터 분석방법을 찾아봐야겠다.
[A modified Adaboost with SVM for relaxing class imbalance problem -이원지, 전치혁(POSTECH) 이기범, 김창욱(연세대학교)]
Class 불균형 문제가 근본적으로 무엇이 문제이고 어떻게 접근해야 하는지 잘 설명해 준 것 같다. 서로다른 class가 단순히 overlap
된 것이 문제인게 아니라, class가 구분되야하는 경계영역에서 overlap된 것이 문제라는 말에 공감되었다. 따라서, 이분야를 연구한
다면, 전체 데이터의 불균형 문제를 해결하는 것보다 경계영역의 불균형에 대해서 집중하는게 좋은 방향이라고 생각된다.
별도로, 이번 학회에서 빅데이터 또는 비즈니스 애널리틱스 분야의 발표가 많은 비중을 차지한 것 같다. 특히 텍스트 마이닝 발표가 많았고 이중에서도 한글을 어떻게 분석할 것인가에 대한 내용이 많았다. 이렇게 핫 한 텍스트 마이닝에 대해 이번 학기에 제대로 배울수 있는 수업(비정형 데이터 분석)이 생겨서 좋은것 같고, 이 수업의 프로젝트가 다소 어렵지만 열심히 해야겠다.