- 2018년 11월 12일 오후 7:57
- 조회수: 727
이영재
[학회 후기]
이번 학회를 참석하면서
데이터 분석을 하는데 있어 다양한 방법론들이 거론되고 이는 산업의 발전에 필수가 되었음을 알 수 있었다. 데이터
사이언티스트가 목표인 나는 머신러닝, 딥러닝, 최적화 등, 데이터 분석에 필수적인 이론을 공부 및 연구할 필요성을 다시 한 번 느낀 뜻 깊은 시간이었다. 또한 DMQA 연구원 분들 및 다른 연구실 분들의 발표를 보면서
교수님께서 항상 말씀해주신 발표의 자세, ppt의 quality, 청취자를
어떻게 이해시킬 것인가에 대해 다시 한 번 생각해보고 미리 연습해볼 필요성을 느꼈다. 많은 산업공학
학생들의 발표와 다양한 주제를 접하는 아주 뜻 깊은 시간이었고 나에게 많은 자극을 준 무대였다.
[청취 후기]
-기조 강연 : Big Data
Innovation
서울대학교
조성준 교수님께서 발표하신 기조 강연이었다. 4차 산업혁명 빅데이터 시대에 맞게 많은 기업들의 데이터
사이언스에 대한 관심과 각 기업 마다 데이터 분석을 하고 결과를 도출해내는 예시를 들어 발표 해주셨다. 현재에는
많은 데이터를 가지고 있지만 유용한 정보가 무엇인지 판단이 어려워 분석을 해본 후에 유용한 정보가 있는지 알아본다. 이러한 흐름은 실제로 유용한 정보가 발견되었다고 해도 좋은 결과를 창출하는데 쉽지 않다. 조금의 생각을 바꾸어 기존의 데이터 분석의 흐름이 아닌 창출하고자하는 최종 목표를 설정하고 목표 달성을 위한
insight를 체계적으로 설정하며 이에 따르는 데이터를 설정하는 것이다. 각 기업들의 데이터 분석에 관한 예시를 들어 깔끔하게 설명해주신 발표였다고 생각한다. 데이터 분석을 하는데 있어 어떠한 흐름이 중요한지 다시 한 번 생각해보는 시간이었다. 또한 앞으로 인공지능, 머신러닝 등의 기술들을 통해 어떻게 하면
기존보다 더 좋은 결과를 만들어낼 수 있을지 고민해보는 뜻 깊은 시간이었다.
-Clear the Fog : Image
Completion in Partially Observed Games with Deep Learning
이
주제에 대한 발표는 introduction부터 집중이 되었던 발표였다.
대부분 사람들이 한번쯤 들어봤을 법한 스타크래프트 게임과 인공지능을 접목시킨 내용이다. 여기서
Convolution Encoder-Decoder를 사용하여 게임 내의 Map의 상항을 예측하는 것이다. 게임 자체에는 많은 변수가 존재한다. 예를 들어, 이 게임에서는 상대의 정보를 모르기 때문에 정찰을 해야한다. 정찰을 통해 상대의 위치, 유닛의 위치 등의 정보를 알 수 있다. 상대의 정보를 가지고 모델을 적용하여 이를 예측하고 더 유리한 상항을 만들어 게임을 진행한다. Map에서 모르는 정보를 모델을 이용하여 어느 정도 예측할 수 있지만 아직은 적은 데이터로 학습이 된 것이다. 추후에 고차원의 데이터를 학습할 수 있도록 시도하면 보다 더 많은 정보를 얻어 게임 내에서 유리하게 진행할
수 있을 것이라고 발표를 마무리했다. 게임에 AI를 접목시킨
주제가 정말 흥미로웠고 학창시절 때의 유명한 게임에 대한 내용이기에 열심히 들었던 것 같다. 또한 발표에
대한 내용을 사자성어를 통해 의미를 전달해준 것이 매우 Impact가 있었고 와닿았다. 매우 흥미로웠고 많은 사람들이 관심을 가질만한 연구였다. 발표를
해준 현구에게 고마움을 전한다.
-Concept Drift Learning
for Nonstationary Traffic Control in Automated Vehicle Systems.
반도체 공정에는 크게 생산,
물류 시스템을 나뉜다. 이번 발표에서는 물류 시스템에서
Wafer를 운반하는 자율 주행에서의 정체구간을 분석하는 내용이었다. 머신러닝을 이용하였을
때, train 시 예측이 잘되었지만 test시 잘 안되었음을
알 수 있었다. 이를 해결하기 위해 Concept Drift, 즉 t1 시점과 t2 시점의 데이터의 분포가 다르다는 것을 설명하였다. 기존의 방법론에는 Blind Method, Informed Method 가
있다. 이 방법론들의 효과와 효율적인 측면을 보았을 때, 많은
데이터를 필요로 하고 update수 또한 많음을 알 수 있었다. 이를
극복하기 위한 방법은 t-1시점까지의 데이터를 통해 예측된 t시점 output값과 t시점 실제 값의 차이인 Loss를 change detection 방법에 사용하는 것이었다. 이 때의 데이터들은 관리도에서 임의의 한계선 두 개, 즉 warning 신호와 drift신호를 알려주는 한계선 사이의 데이터를
이용한다. 결과적으로 기존의 방법론들보다 더 적은 update 횟수를
보였고 효율적 측면에서도 좋은 결과를 보였다. 향후 연구에서는
Parameter tuning을 시도한다는 것으로 발표를 마무리 하였다. 향후 계획을 적용한
연구는 어떤 결과를 보여줄지 기대가 되는 주제였다. 반도체 산업은 한국이나 세계에서도 매우 중요한 시장으로
자리 잡고 있어 현재 연구와 더불어 많은 연구가 진행될 필요가 있다고 생각한다. 기회가 된다면 제조분야
쪽으로 연구를 해보고 싶다는 생각이 들었다. 학회 발표를 해준 성호 형에게 고마움을 전한다.