고려대학교 DMQA 연구실

2018 대한산업공학회 추계학술대회 - 조용원

2018년 11월 12일 오후 2:09
조회수: 768

Reviewed by

조용원

이번 학회를 들으면서 느낀점은 딥러닝은 선택이 아닌 필수가 되어버린듯한 느낌이었다. 과거에는 모델 자체의 능력에 집중한 연구에 관한 논문들이었다면, 지금은 분석의 방법으로 많이 쓰이는 것 같다. 또한 강화학습을 이용한 연구들도 많이 보였다. 머신러닝을 연구하기로 마음 먹은 나는 기본을 잘 공부하여 나의 연구에 도움될 수 있도록 해야겠다는 생각을 했다. 또한 산업공학의 분야가 넓지만, 데이터 과학이라는 분야는 현재의 시대를 살아가는 나로써 반드시 알고있어야 할 것이라는 생각을 했다. 또한 교수님께서 항상 조언해주시는 것처럼 발표할 때, 어떻게 해야 청취자들의 이해도를 높일수 있는지에 관해 다시 한번 생각해 볼 수 있는 기회였다. 나도 발표를 할 기회가 있다면 항상 이부분을 명심해서 PPT를 준비해야 할 것이다. 한 슬라이드에 많은 내용을 적는 것과, 어려운 수식보다는 이해를 할 수 있는 그림이나 다른 자료들을 이용해야겠다. 전체적인 나의 생각은 위와 같다.

[청취 후기]

- 기조강연 : Big Data Innovation

이번 학회의 기조강연은 서울대 조성준 교수님께서 해주셨다. 교수님은 산업공학과 컴퓨터 공학을 모두 전공하신 분으로써, 4차 산업혁명시대에 산업공학의 위치에 관한 설명과 데이터 분석에 관해 많은 이야기를 해주셨다. 가장 인상 깊었던 이야기는 '제조가 서비를 데려간다.' 라는 문장이었다. 위의 문장만 들었을 때는 이해가 되지 않았지만, 예를 통해 이해가 가능해졌다. 예를 들어, 삼성이 시스템 에어컨을 만들 때, 센서를 넣어 건물에 바람이 얼마나 들어오는지, 온도가 어떻게 변하는지에 관해 측정할 수 있다면 삼성전자가 건물의 유지 및 보수를 담당하는 분야로도 진출 할 수 있다는 내용이었다. 지금 연구하고 있는 데이터 과학이라는 분야의 발전 가능성에 또 다른 부분으로 생각 할 수 있는 기회가 되었다. 또한 데이터에서 인사이트를 얻고 그 인사이트를 통해 가치를 생산할 수 있고, 역방향으로도 데이터 과학자들의 역할이 존재한다는 이야기 해주셨다. 나는 기조강연을 통해 앞으로 데이터 과학에 관해 연구를 하거나, 데이터를 분석할 때 위의 이야기들을 명심해야겠다고 다짐했다. 기술 자체에 대한 발표도 중요하지만, 시대의 흐름에 대한 기조강연도 매우 유익한 시간이었다.

- 선형정수계획을 이용한 양자 컴퓨팅 이진 논리 오라클 회로 최적화

나는 최적화와 관련된 수업을 듣기 위해 최인찬 교수님의 수업을 수강하였다. 교수님의 연구분야라고 말씀해주신 양자컴퓨팅이라는 주제에 관하여 처음으로 들을 수 있는 발표였다. 현재 우리가 쓰고 있는 0과 1로 볼 수 있는 비트단위의 자료들이다. 하지만 양자컴퓨팅에서 쓰는 데이터의 형태는 비트가 아니라 큐빗이라는 단위였다. 큐빗의 상태에서는 우리가 직접 큐빗을 확인하기 전 까지는 해당 값이 0인지 1인지 알 수 가 없다. 즉 두가지 값을 중첩하고 있다고 할 수 있다. 큐빗은 0일 확률과 1일 확률 상태를 포함하고 있지만 정확히 이 값이 얼마인지는 모른다. 특정 확률 값들을 가진 이 큐빗이 게이트를 통과하면 해당 값이 얼마인지 알 수 있다. 그래서 어떠한 게이트를 써야 0과 1이 가진 확률값을 통해 큐빗에 값이 할당되는 지와 이를 관련한 네트워크를 해결하는 문제를 푸는 과정을 설명해준 발표였다. 다품종 할당 모형을 이용해 큐빗의 값들을 확정하는 과정을 보여주었다. 다품종 흐름(Multi Commodity Flow) 모형은 일종의 선형모형이지만 NP-C 문제에 속하는 문제여서 매우 어렵지만, 양자컴퓨팅을 이용한다면 매우 빠르게 휴리스틱 해를 구할수 있다고 하였다. 이부분에 관해서 설명은 없었지만, 추후에 알아볼 예정이다. 또한 매우 빠른 연산속도를 이용해 휴리스틱 해에 관한 평가도 가능하다고 하였다. 지금 연구할 머신러닝 알고리즘 자체도 중요하지만, 알고리즘이 아무리 뛰어나도 알고리즘 내의 연산을 할 때 오랜시간이 걸린다면 예측을 주로 하는 현재에는 무의미 할 것이라는 생각이든다. 지금은 알아 나가야할 문제들도 많지만, 추후에는 꼭 연구해보아야 할 분야임에는 틀림없다. 최적화와 관련의 수업의 조교로 많은 도움을 주었던 정지혜 연구원에게 감사를 표한다.

- Clear the Fog : Image Completion in Partially Observed Games with Deep Learning

연구실 선배인 현구의 발표를 처음 들을 수 있었다. 현구의 발표를 듣고 느낀 것은 교수님께서 말씀해주신 발표할 때 중요한 포인트들을 그대로 실천하는 모습이었다. 우선 처음에 긴장한 느낌이 전혀 없었다. 또한 청취자들을 이해를 돕기 위해 예시들을 이용해서 듣기 쉽게 설명해주었다. 이러한 점은 본받아야겠다는 생각이 많이 들었다. 논문에 관해서는 Convolution Encoder-Decoder를 사용해서 스타크래프트 게임에서 Map의 상황을 예측을 하는 것이었다. 스타크래프트는 매우 많은 변수들이 존재하기에, 강화학습의 여러 Agent의 상황에 관해 실험할 수 있는 최고의 Simulator이다. 여기에서 상대의 정보를 모르는 상태에서 게임을 진행 해야하기에 정찰은 필수적이다. 정찰을 통한 몇몇의 정보를 위의 모델을 이용하여 예측해서 상대보다 더 많은 정보를 가지고 게임을 할 수 있다는 것은 매우 유리한 상황에서 게임을 진행해 나아가는 것이다. Map의 정보를 많이 줄였지만, 계산을 더 빠르게 할 수 있는 알고리즘이 개발되어 정보의 양을 더 많이 가져올 수 있는 방법이 있다면, 더 유리한 위치에서 게임을 할 수 있을 것이다. 게임 자체로도 나에게 많은 즐거움을 주는 스타크래프트이지만, 연구과제로도 매우 뛰어나다는 것을 다시 한번 일깨워준 현구에게 감사를 표한다.

- Graph-free Label Propagation with Collaborative Dual Evolving Network for Big Data

해당 주제와 관련한 내용은 18년 5월에도 들은적이 있었다. 하지만 이해못하는 부분이 태반이었지만, 현재 이해되는 부분은 매우 커졌다. 해당 논문은 Semi-Supervised Learning의 부분인 Label Propagation의 한계와 이를 극복할 새로운 알고리즘에 대해 소개하는 자리였다. Input data의 사이즈가 작다면 Label Propagation은 충분히 활용도가 높다고 할 수 있다. 하지만 이미지 데이터와 같이 사이즈가 크다면 Label Propagation의 활용도는 낮다. 왜냐하면 거리를 구해서 진행하기 때문에, 매우 오랜 시간이 걸리기 때문이다. Cifar10-dataset에 대해서 KNN방법과 CNN방법을 사용할 때 확인하였지만, 매우 큰 계산속도의 차이가 발생한다. 그래서 발표자가 제시한 방법은 Collaborative Dual Evolving Network(CODEN)이었다. 해당 방법은 데이터 사이의 길이 존재할지에 관해 예측하는 모델과 어떠한 Label을 정해주는 지에 관한 모델을 각각 설립하여 이들이 협력적으로(Collaborative)하게 작용하는 알고리즘을 제시했다. 발표의 내용 중, Label의 종류는 2가지 였고 이들에 관해 동일한 개수로 레이블이 없는 데이터들이 할당 받았다. 즉 Balanced라고 할 수 있는 상황이었다. 청취자의 질문처럼 Unbalanced한 상황이라면 어떻게 논문의 알고리즘이 적용 가능할지에 관한 의문이 존재하였다. 이 내용을 듣고 Semi-Supervised Learning에 관해 관심을 가지게 해준 영훈이형에게 감사를 표한다.

Conference