[학회 후기]

석사 과정 중 연구실 단위로 참석하는 마지막 학회가 될 2025 한국데이터마이닝학회 하계학술대회에 참가했다. 평창이라는 도시가 주는 기대감은 5도 낮은 기온이 충분히 충족시켜줬다고 생각한다. 알펜시아 리조트에서 이루어진 학회는 여러 연사 분들의 강연으로부터 시작되었고, 지난 해 추계 학회와 마찬가지로 많은 연구원들의 포스터 세션이 이뤄졌다. 항상 학회에 오면 다들 열의를 가지고 학회를 참석하는 모습이 나에게 영감을 준다. 나 역시 "반도체 제조자원 정보를 활용한 계층적 딥러닝 방식의 수율예측" 이라는 주제로 포스터 발표를 진행했다. 1시간 반동안 진행되는 포스터 세션인데 분야가 너무 세부적이어서 청중의 관심이 크지 않을 것이라 생각했는데 다양한 연구원들이 실험 결과의 세부적인 내용까지 질문을 해줘서 이러한 연구를 했다는 데 자부심마저 들었다. 작년에는 비교적 부족한 연구 내용이었다면 이번에는 어느정도 결과가 나온 상황이라서 더 자신감 있게 답할 수 있었다고 생각한다. 다만 분야별로 세션 및 시간이 분배되어있어 관련된 제조 분야의 다른 포스터 발표를 자세히 볼 시간이 부족한 점은 조금 아쉬웠다. 


[발표 후기]

주제: "반도체 제조자원 정보를 활용한 계층적 딥러닝 방식의 수율예측" 

현대 산업의 급속한 발전은 반도체 공정의 미세화를 가속시키고 있다. 이로 인해 개별 공정의 복잡성과 공정 사이의 상호 작용이 크게 증가하였다. 기존의 수작업 기반의 분석이나 계측 데이터에 의존한 머신러닝 기법에 기반하는 경우, 시간과 자원이 많이
소모되며, 이러한 상호 작용이 반영되기 어렵다는 한계가 있다. 이러한 문제를 해결하기 위해, 본 연구는 수치형 계측 데이터 없이 공정 진행 데이터만을 활용하여 웨이퍼 수율을 예측하는 계층적 딥러닝 접근법을 제안한다. 제안된 방법은 장비(equipment), 챔버(chamber), 레시피(recipe), 마스크(mask)의 네 가지 핵심 공정 조건을 기반으로, 조건(condition), 공정(process), 상호작용(interaction)의 세 가지 수준에서 수율을 예측한다. 이 과정에서 제조 흐름의 시간적 특성을 포착하기 위해 gated recurrent
unit(GRU)을 사용하고, 공정 단계 간의 중요도를 학습하기 위해 어텐션 메커니즘을 도입하였다. 실제 한국의 반도체 생산 공장에서 수집된 데이터에서 실험이 진행되었으며, 제안된 방식은 기존 방법들에 비해 예측 정확도 및 강건성 측면에서 향상된 성능을 보였다. 이러한 결과는 복잡한 제조 현장에서 의사결정을 지원하는 데 있어, 제안된 방법이 효과적인 방법으로 활용될 수 있음을 시사한다.

#1

질문. End to End 방식으로 설계되지 않은 점이 의아하다.

답변: 개별 모델의 성능차이가 있는 데 End to End 방식으로 학습할 경우 전반적으로 유리한 Process 모델을 중점으로 학습되어 저수율, 고수율 영역에서 더 효과적인 Condition, Interaction 모델은 효과적으로 학습이 되지 않았다. 그래서 학습을 별도로 진행하였다.

#2

질문. 도메인 지식이 필요한 모델인가?
답변. 도메인 지식을 반영하여 추가적인 피쳐 엔지니어링 및 모듈화를 활용해 유사한 아키텍쳐로 구현한 기존 연구는 존재한다. 하지만 현재 계속해서 고도화 되고 있는 공정은 도메인 엔지니어도 모든 의존성을 파악하지 못한다. 그래서 Data Driven 방식으로 구현하였기 때문에, 도메인 지식이 크게 필요하지않다.


[청취 후기]

1. Continual Self-Supervised learning for Skeleton-based Human Action Recognition (안시후 / 고려대학교)

새로운 행동 패턴이 계속 발생하는 상황 때문에 기존에 학습한 지식을 최대한 유지하면서 효과적으로 새로운 행동을 학습하기 위해 Continual 이용함과 동시에
자기 지도 학습을 통해 행동에 대한 학습을 효과적으로 진행하여 새로운 행동 데이터에 대한 인식 정확도와 적응 능력에서 일관된 좋은성능이 확인되었다.
그런데 생각보다 전체적인 성능이 좋지 않은 부분이 있다보니 이전 연구 및 개선 연구에서의 성능 확인이 되었지만 앞으로도 발전 가능성이 많다고 생각했다. 


2: Generative AI for Causal Reasoning: Foundation and Algorithms (임성빈 / 고려대학교)

Causal Reasoning이라는 주제를 생성형 모델과 접목시켜 연구하는 최근의 흐름에 대해 다룬 강연이었다. 
발표에서는 LLM을 활용하여 Causal Reasoning 문제를 다루는 다양한 방법론이 소개되었는데, 이를 통해 얻은 답변이 
과연 학습된 지식을 활용한 것인지, 혹은 단순히 가능성 있는 결과를 만든 건지 판단이 어려운 문제가 존재한다는 점이 인상 깊었다.
이러한 문제를 해결하기 위해 Diffusion 모델을 활용하는 활발히 이뤄지고 있는데 Diffusion 모델은 실제 데이터의 분포를 파악하기는 어렵지만, 
Score 분포를 추정하는 데 유리하여 이를 활용하여 Causal Reasoning 문제를 풀어가는 연구가 활발히 진행되고 있다는 점이 인상적이었다. 
 앞으로 해당 분야가 더욱 발전해 나갈 수 있을 것이라는 기대감을 가지게 되었다. 전체적으로 발표 스타일이 흥미로워서집중하면서 본 강연이었다.