2018 산업공학회 춘계학술대회는 경주에서 개최되었다. 다양한 주제의 연구들이 발표되었으며, 반도체 관련 발표가 예전에 비해 많아진 것이 흥미로웠다. 비즈니스 애널리틱스 세션이 많은 것은 좋았으나, 같은 시간대에 여러 세션이 겹쳐있어 듣고싶었던 모든 주제를 들을 수 없었던 것이 조금 아쉬웠다.

 

[발표 후기]

이번 학회에서는 Multi-Task Variable Subset Selection for Multi-Output Regression Problems라는 주제로 발표하였다. Multi-task learning은 서로 다른 데이터 셋을 갖는 task들이 주어졌을 때 task간 common information이 있을 것이라고 가정하고 이를 이용하여 모델의 성능을 향상시키려고 시도하는 기계학습 방법론이다. Multi-task learning 방법론에는 다양한 방식이 있는데, 이번에 발표한 연구에서는 common feature subset sharing이라는 접근 방식을 사용하였다. 이는 multi-task 문제 상황에서 지도학습을 수행할 때, 전체 또는 일부 task에서 공통된 중요 feature를 갖는다고 가정하는 방식이다. Common feature들을 찾아내기 위해서 기존 연구들은 row-wise sparsity를 유도하기 위해 row-wise group penalty 또는 row sparsity indicator 변수를 정의하였다. 제안 방법론은 row-wise sparsity indicator를 사용하는 discrete optimization problem으로 정의되었으며, 이를 효율적으로 풀어내기 위한 projecte gradient descent 방법론을 제안하였다. 제안하는 방법론은 간단한 시뮬레이션 상황에서 기존 common feature subset selection에 비해 좋은 성능을 나타내었으나, 더 의미있는 시뮬레이션 및 실제 데이터에서 검증이 필요하다.
 

- 질문 1: 실험한 시뮬레이션 세팅이 제안하는 방법론에 유리한 것은 아닌가

- 답변 1: 시뮬레이션 세팅이 매우 간단하게 되어있긴 하지만, 모든 output(task)이 같은 중요 변수를 갖는 상황이기 때문에, 특별히 제안 방법론이 유리한 상황은 아닐 것으로 생각한다.

 

- 질문 2: Multi-task learning은 task들이 서로 다른 instance를 갖고 있는 것으로 알고있는데, 실험에서는 같은 데이터 셋이 사용된 것 같다.

- 답변 2: 이번 발표에서는 multi-task learning을 이용한 multi-output regression 문제에 초점을 두었기 때문에 task간 차이는 반응 변수가 다르다는 것 밖에 없으며, 모든 task는 예측 변수의 관점에서는 같은 instance를 갖는다. 추후 일반적인 multi-task learning 상황에서도 방법론을 실험할 예정이다.

 

발표를 준비하면서 알고리즘을 설계할 때 생각하지 못한 여러가지 어려움이 있었으며, 어떤 면에서 제안 모델의 장점을 부각할 수 있는지 많은 고민이 필요하다는 생각이 들었다.

 

[청취 후기] 

- SAO2vec: SAO(Subject-Action-Object) 구조와 Doc2vec을 이용한 SAO 임베딩 알고리즘 개발

최근 다양한 분야에서 word2vec, doc2vec의 아이디어를 활용하거나, 변형하는 연구들이 발표되고 있다. SAO에 대해 알지 못해 발표의 자세한 내용을 이해하기는 어려웠지만, 텍스트 및 텍스트의 집합인 문서를 분석하는데 있어 활용도가 높은 방법론이라는 생각이 들었다. Word2vec, doc2vec에 대한 아이디어를 충분히 공부한 뒤, 추후 텍스트 분석을 진행할 때 활용할 수 있을지 고민해봐야겠다.


- 반도체 웨이퍼의 표면 불량을 자동적으로 분류하는 CycleGAN 기반 방법

반도체 웨이퍼 표면 불량을 자동 분류하기 위한 방법론을 제안한 발표였다. ADC 시스템을 통해 불량이라고 분류된 웨이퍼의 불량 판정을 야기한 부분의 이미지를 넘겨받은 뒤 웨이퍼 불량의 종류를 분류하기 위한 방법론으로, GAN 기반의 one-class classification 방식을 사용하였다. 기본적으로 불량의 이미지를 통해 불량 종류를 식별하는 방식의 정확도가 높아 일반적인 CNN classifier를 사용했을때에 비해서 분류 성능이 아주 좋은것은 아니었지만, class imbalance가 있을 때에 CNN에 비해 좋은 성능을 보였으며, CNN과는 다르게 사전에 정의되지 않은 이상 class에 대해서도 알려지지 않은 이상이라는 정보를 줄 수 있다고 한다. 분류 성능은 좋게 나왔으며, GAN 계열 모델을 one-class classification에 실제로 사용했다는 점이 흥미로웠다.


- 반도체 다채널 센서 데이터 분석을 통한 주요 인자 선택 알고리즘

웨이퍼의 두께를 가상계측하기 위한 가상계측 모델을 학습하는 사례 연구였다. 웨이퍼의 다양한 위치의 두께를 측정하고 이를 예측하기 위한 모델을 학습하였는데, 위치들의 평균 값을 예측하거나, multi-task learning 등의 접근 방식을 사용한 것이 아닌, dummy variable을 이용한 예측 모델을 사용한 것이 흥미로웠다. 중요 변수 선택에 있어 대표 값들 간의 상관관계만 본 것이 아쉬웠으며, 각 공정-센서 별로 서로 다른 대표 값 간의 관계를 보고 변수 선택을 진행하면 좀 더 의미있는 결과를 얻을 수 있을 것 같다.​