1. 학회 후기
미국 시애틀에서 개최된 INFORMS annual meeting에 참가하였다. 개인적으로 미국에 방문하는 것은 처음이었기 때문에 또 다른 설렘이 있었던 것 같다. 대만에서 열린 INFORMS International에는 한번 참가하였던 경험이 있지만, 이번 annual meeting에서는 그때와는 다르게 전세계적으로 산업공학이라는 분야에서 어떤 연구가 주로 이루어지는지 알 수 있었다. 또한 연구실에서 많은 인원이 참가했던 만큼 서로의 경험을 공유해가면서 세션을 청취하고 학회 기간을 보낼 수 있어서 더욱 의미 있게 보낼 수 있었던 것 같다. 개인적으로는 앞으로의 개인 연구에 대한 동기부여가 확실히 되었으며, 귀국 후 내가 연구하고자 하는 부분에 더욱 집중적으로 시간과 노력을 쏟아야겠다고 느꼈다.
국내에서 참가했던 대한산업공학회, 데이터마이닝학회와는 다르게 INFORMS에서 발표된 분야는 엄청나게 다양했다. 최적화, SCM, 물류, 생산, 품질, 데이터마이닝 등 산업공학을 이루는 각 구성요소 안에서도 알고리즘, 어플리케이션 분야가 매우 다양했다. 그만큼 산업공학이 적용될 수 있는 분야가 넓고 가능성이 크다는 생각이 들었다. 또한, 데이터마이닝이 최적화 못지않게 많은 주목을 받고 여러 사람들이 연구하고 있다고 생각했다. 많은 세션 발표가 데이터마이닝에 관련된 주제를 갖고 있었으며 방법론적으로도 전통적인 통계 기법, 기계학습의 적용, 그리고 일부이지만 딥러닝 모델을 사용한 연구도 심심치 않게 볼 수 있었다. ‘아직까지도 옛날 이론들을 갖고 이렇게 많은 연구를 하나?’라는 생각도 잠깐 들었지만, 하나의 이론을 발표하기까지 오랜 기간의 연구가 필요하고 우직한 노력이 느껴져서 즐겁게 세션을 청취할 수 있었다.

2. 발표 후기
Equipment Failure Prediction for Multi-Channel Sensor Data라는 제목으로 구두 발표를 했다. 영어권 국가에서 영어로 발표를 한 적은 처음이라 여느 때 보다 많이 긴장을 했다. 연구실에서 공동 연구로 진행한 Hierarchical Feedforward Attention Network(HFAN) 알고리즘을 기반으로 하여, 차량에서 수집한 센서 데이터를 분석하고, 최종적으로는 Valve Failure of Exhaust Gas Recirculation System을 예측하는 연구에 대한 발표였다. EGR Valve는 디젤 자동차의 엔진에서 배출되는 NOx의 양을 저감시키기 위한 시스템이다. Valve의 열림량을 조절하여 NOx 양을 줄이는데, 다양한 원인으로 인해서 목표 열림량과 실제 열림량 패턴이 다르게 나타나는 현상이 발생한다. 이를 해결하기 위해 차량에서 수집한 Multi-Channel 센서 데이터를 분석하는데, sensor & time-series of sensor라는 계층적인 구조로 데이터를 바라보기 위해 HFAN을 사용했다. 또한, attention을 사용했기 때문에 왜 이상이 발생 했는지도 파악할 수 있는 장점을 갖고 있다. 발표 전까지 계속 연습을 했지만 막상 발표를 마치고 나니 전달하고자 했던 내용 중 미처 말하지 못한 것이 생각나 아쉬움이 남았다.
질문 중에서 ‘다양한 이상 종류가 있는데 왜 분류 모델을 사용하지 않고, 예측 모델을 사용하였는가?’라는 내용이 있었다. EGR valve의 이상은 모든 패턴을 정의할 수 없을 정도로 다양한 모양으로 나타나고, 일부는 두 가지 이상의 패턴이 섞여서 나타나기도 한다. 예를 들어, 실제값이 목표값을 역전하는 현상과 유사한 패턴으로 늦게 발생하는 현상이 동시에 일어나기도 한다. 또한, 디젤 엔진마다 목표-열림 차이값에 대한 이상 기준값이 상이하기 때문에, 특정한 값을 기준으로 정상과 이상을 나누기도 힘들기도 하다.

3. 청취 후기
INFORMS에서 다양하고 많은 종류의 발표가 동시에 진행이 되어 청취할 세션, 발표를 선정하는 것부터 다른 학회보다 많은 고민을 했었다. 가장 중점적으로 청취한 세션은 현재 연구를 진행하고 있는 timeseries, sequential 데이터에 대한 분석과 관련된 세션들이었다. 컴퓨터 학회가 아닌 만큼 뉴럴네트워크와 관련된 기법이 소개되기 보다는, 데이터에 대한 전처리를 어떻게 수행해서 분석 모델을 사용할 것인가에 대한 내용을 많이 청취할 수 있었다. 다소 생뚱맞을 수도 있고 너무 옛날 기법을 사용했다고 느끼기도 했지만, 연구는 다양한 방법으로 접근할 수도 있다는 것을 다시 한번 느끼게 되는 계기였다. 예를 들어 multivariate timeseries classification을 수행하는데 있어서, 특정 윈도우를 여러 개의 segment로 나누어, 각 segment 안에 있는 데이터의 평균을 구하고, 각각의 값을 a/b/c 등의 categorical 변수로 바꾼다. 이렇게 되면, 하나의 윈도우는 accb 등과 같이 표현을 할 수 있는데 여기에 bag-of-words 알고리즘을 사용해서 데이터를 전처리하는 경우도 있었다. 엉뚱하기는 했지만, 윈도우 내에서 ‘높고 낮음’의 패턴 변화를 나타내기 위한 방법으로는 논리적인 접근이지 않을까 라는 생각도 들었다. 그 다음으로 청취한 것은 network, graph에 대한 세션들이었다. 네트워크 분석을 하기 위해 가장 중요한 것은 적절한 네트워크를 만드는 것이다. 네트워크를 구성하는데 있어서 성별, 나이 등과 같은 특정 attribute가 너무나도 중요하게 작용하기 때문에, 이런 속성들에 쏠리지 않도록 균형을 잡는 것이 중요하다. Fairness – invariant to particular sensitive attribute라고 표현을 했다. 이렇듯 각 문제 상황을 명확하게 정의하고 해결할 수 있는 방안을 내는게 연구의 올바른 순서라고 생각된다.

4. 시애틀에서…
학회 일정을 마무리하고 시애틀에서 자유로운 시간을 가졌다. 개인적으로 해외에 나가서 공원을 한번쯤은 들리는 것을 즐기기 때문에 차로 20분 정도 떨어진 매그너슨 공원에 갔다. 미국 뿐만 아니라 서양에 가면 아침에 아이들과 반려견들을 데리고 산책하는 사람들을 종종 볼 수 있다. 특히 이번에 간 곳에서는 개의 목줄을 자유롭게 풀어놓을 수 있는 off-leash area가 있어서 좀더 평화로운 일상을 엿볼 수 있었다. 아침에 산책, 운동 등을 하면서 건강한 시간을 보내는게 부럽기도 하면서 시간 관리에 대한 동기 부여도 받을 수 있었다.
오후에는 아마존 본사에 방문했다. 지난번에 ID와 카드를 등록하지 못해서 밖에서만 바라봐야 했는데, 안내해주신 이준호, 윤수빈 박사님 덕분에 직접 물건을 들고 나와 볼 수 있었다. 영상에서만 봤던 장면이었는데 직접 해봐서 신기했다. 아마존에서 각자 하고 계신 업무, 입사하기까지의 스토리, 아마존이라는 회사의 문화, 미국에서의 삶과 같이 다양한 질문을 하고 답변을 들으면서 지금까지 접해보지 못했던 라이프에 대한 궁금증과 욕심이 생겼던 것 같다. 외국인으로써 영어를 잘 해야 한다는 것은 예전부터 알고 느꼈던 것이었지만, 자신이 원하는 기회를 잡기 위해서 적극적으로 자기 자신을 PR할 수 있어야만 한다는 것이 가장 크게 다가왔다. 한국에서 자기를 PR하면 아무래도 눈치를 받기 때문에 위축될 수 밖에 없지만, 오히려 세계에서는 자신의 selling point를 알아야만 한다.