[학회후기]

정말 오랜만에 오프라인 학회에 참가하여 청중들 앞에서 발표할 수 있었다는 점에서 즐거운 경험이었다. COVID로 인해 작년에는 학회에 참가를 하지 못했고, 올해에도 온라인으로만 발표를 겨우 할 수 있었다. 또한 연구실 세미나도 계속 온라인 동영상으로 진행이 되었어서 현장감을 느낄 기회가 없었는데, 이번에 발표를 하고 또 들으면서 어느정도 충족을 시킬 수 있었던 것 같다. 예상했던 것보다 많은 사람들이 현장참가를 했으며 발표장도 많은 인원으로 가득 차 있는 경우가 대부분이었다. 오랜만에 세션장을 돌아다니면서 관심있는 연구에 대한 발표를 들으면서 지식을 쌓을 수 있었고, 그동안 소홀히 했던 다양한 분야에 대해서 어느정도 트렌드를 잡을 수 있었다. 개인적으로 SHAP가 생각보다 여러 도메인에서 적용되어 모델 해석에 사용되었다는 것과 컴퓨터공학 중 private AI/서버에서 많이 다루는 Federated Learning을 산업공학회에서 볼 수 있었다는 것이 신선한 자극으로 다가왔다. 아쉬운 점은 역시 연구실에서 많은 인원들이 학회에 참가했음에도 불구하고  서로 조심해야 하는 시기이기 때문에 모여서 같이 시간을 보낼 수 있는 인원과 시간이 한정되어 있었다는 것이다.


[발표후기] 

제목: 휴대폰 공정에서의 주요 검사 항목 선정 프로세스 (곽민구, 강성현, 김성범)

비단 휴대폰 뿐만이 아니라 어떤 제품이 완성되면 다양한 기능을 온전히 수행할 수 있는지 검사 공정을 거치게 된다. 휴대폰의 성능이 점점 더 좋아지고 고화소 카메라, 5G, 폴더블 등 다양한 기능이 추가되면서 검사 공정을 위한 설비를 설치하고 검사를 하는데 많은 비용과 시간이 필요하다. 하지만 실질적으로 검사항목들을 살펴보면 서로 관련성이 매우 높은 항목들이 많이 있다. 본 연구의 목표는 휴대폰 검사 공정 시간을 최소화하고 효율성을 극대화하기 위해 서로 연관성이 있는 검사항목들 중 일부 계측 검사항목에 대해서만 검사를 진행하고, 나머지는 가상계측 검사항목으로써 예측모델을 통해 값을 대체하는 프레임워크를 제안했다.

프레임워크는 총 3단계로 이루어져 있다. 첫 번째로 검사항목간 관계를 sparse precision matrix로 표현하고 이를 그래프로 시각화한다. Precision matrix를 사용하면 일반적인 상관계수와는 달리 두 검사항목 사이의 관계를 정량화할 때 다른 검사항목들의 영향력까지 고려하여 산출할 수 있다. 또한, 적은 개수의 검사항목을 선택하기 위해 검사항목간 관계를 더욱 sparse하게 만들어야 하는데 이를 위해 graphical lasso 알고리즘을 적용했다. 산출한 sparse precision matrix를 사용하여 네트워크/graph를 만들었으며, 두 번째로 각 subgraph에 속해있는 검사항목의 중요도를 산출하기 위해 PageRank를 적용했다. 이는 노드의 상대적 중요도를 산출할 수 있는 알고리즘이다. 예측이 어려운 검사항목들을 계측해야 하기 때문에 PageRank가 낮은 검사항목들부터 시작하여 PageRank의 누적합이 0.4보다 클 때까지 선택하였다. 마지막으로 선택된 전체 계측 검사항목을 사용하여 가상계측 검사항목 1개당 1개의 light Gradient Boosting Machine 모델을 구축했다. 결과적으로 66개 중 22개 가상계측 검사항목에 대한 예측을 수행했으며 R-square 평균 91.2% (90% 이상 15개)의 결과를 얻을 수 있었다.

예측이 잘되지 않은 검사항목의 특징을 살펴보면 관련성이 높은 검사항목이 1~2개로 매우 적은 경우였으며 이를 해결하기 위해 특정 개수 이상의 검사항목이 subgraph를 구성하고 있을 때 계측 검사항목으로 선택하는 것이 필요하다고 생각된다. 또한, 추후 연구에서 가장 필요한 점은 비교 알고리즘/연구를 탐색하는 것이다. 기존의 가상계측은 일부 샘플들에 대해서 일부 변수를 측정하기에 생기는 missing value를 해결하기 위한 프레임워크이고 최종적으로 예측하고자 하는 타겟 변수가 존재한다. 기존의 변수선택 알고리즘 또한 특정 변수를 예측하기 위해 의미있는 변수만을 필터링하는 과정이다. 이에 비해 발표 연구는 전체 변수 중에서 설명변수와 타겟변수를 분리하는 새로운 문제 상황을 제시하는 것이기 때문에 기존 가상계측 혹은 변수선택 연구들과 동등한 레벨에서 비교하기에 어려움이 있다.


질문 1. 본 연구가 가상계측이 잘 되는 검사항목을 선택하기 위한 것인가?

답변 1. 결과적으로 보았을 때는 맞다. 서로 연관성이 존재하는 검사항목들끼리는 서로 어느정도 대체를 할 수 있다는 큰 가정하에 진행이 된 연구이다. 연관성을 분석하여 필수적으로 계측해야만 하는 검사항목들을 필터링하고, 이를 사용해서 선택되지 않은 검사항목의 계측값을 예측했을 때 실제와 매우 유사한 값이 나와야 실제 공정에서 대체가 가능하다.


질문 2. ’가상계측‘에 대해서 추가적인 설명을 해 줄 수 있겠는가?

답변 2. 본 연구에서 가상계측이라는 용어를 사용했지만, 사실은 완벽하게 알맞은 용어는 아니다. 일반적으로 가상계측이라는 용어는 샘플별로 계측된 변수의 종류가 서로 달라서 결측치가 존재할 때, 이를 메꾸고 최종적으로는 특정 타겟 변수(불량률, 수율 둥)에 대한 예측력을 가지고 평가를 한다. 하지만 본 연구에서는 계측은 다 할 수 있는 상황이지만 효율성을 높이기 위해서 일부 평가항목을 예측값으로 대체하겠다는 의미에서 가상계측이라는 용어를 사용했다.