2024 한국데이터마이닝학회 춘계학술대회 - 백민지
- 2024년 5월 31일 오후 4:28
- 조회수: 449
Reviewed by
백민지

[학회 후기]
2024년 5월 30일, 양재 엘타워에서 개최된 한국데이터마이닝 춘계학술대회에 참여하게 되었다. 작년 추계학술대회에 이어 2번째로 참가하게되었는데, 작년에는 청취자로 참여했지만 올해는 발표자로 참여하게 되어 마음가짐이 달랐던 것 같다. 발표장이 큰 홀로 구성되어 많은 인원들이 편안하게 청취할 수 있어서 좋았고, 관심있는 세션을 열심히 들으러 다녔다. 세션마다 발표시간이 잘 엄수되어서 밀도 높은 발표를 들을 수 있었고, 또한 청취자들도 오히려 더 집중있게 들을 수 있었던 것 같다. 석사 2년차로서 학회경험은 정말 값진 경험이다. 다른 연구자들이 어떤 연구를 하는지 또 어떤 분야의 연구들이 많이 이루어지는지 식견을 넓힐 수 있는 중요한 자리이기 때문이다. 다양한 청취 후, 내 연구도 발표를 해보는 중요한 경험 이후에 연구실 인원들과 함께 저녁식사를 한 즐거운 날이었다.
[발표 후기]
이번 학회에서 '반도체 공정 소재 품질을 위한 시계열 및 이미지 변환 데이터 활용 멀티모달 이상치 탐지'라는 연구주제로 발표를 진행했다. 반도체 공정 중에는 다양한 소재가 사용되는데, 이때 품질 이상이 생기게 되면 1차적으로 해당 소재를 사용한 Wafer를 전량 폐기해야하는 문제점이 생기고, 2차적으로는 해당 소재를 교체하는동안 공정지연이 생기게 되므로 이런 문제점을 해결하기 위해 딥러닝을 적용한 소재 품질 모니터링을 위한 이상치탐지 연구를 하게 되었다. 학습과정에서 정보를 풍부하게 사용하기 위해 멀티모달 구조를 채택하게 되었고, 원래의 데이터를 Tabular/Image로 변환하게되었다. 또 오토인코더 기반의 구조에서 Masking과 Attention layer를 추가하여 강건하게 학습시키며, 중요한 정보를 더욱 잘 학습하게 하는 구성요소를 추가했다. 기존 이상치 탐지 방법론의 실험과의 성능 비교와 절제 연구를 끝으로 발표를 마쳤다. 해당 데이터를 얻은 방식이나 실제 현업에서 사용하기 위한 성능 기준이라던지, 다른 절제 연구 수행에 대한 질문을 받았다.
[청취 후기]
튜토리얼
-데이터 인텔리전스 기업에서의 안전한 AI 활용
기업에서 성장을 택할것이냐 안전성을 택할것이냐라는 서두로 시작된 튜토리얼은 상당히 흥미진진했다. 보통의 기업들은 성장을 더 중요시 여기고 안전성이 트레이드오프관계에 놓여있다고 생각하는 부분이 있으며, 이의 빈틈을 노린 범죄가 최근 LLM의 발전과 더불어 증가하고 있다고 한다. 사례중에서 법원의 데이터 관리자의 비밀번호가 몇년간 바뀌지않아 해킹을 당한 사례가 있었는데, 주기적으로 비밀번호를 변경해야할 중요성을 느끼게 되었다. 결국 회사는 안전성을 함께 택할때 오히려 그 성장이 더 커질 수있다는 마무리와 함께 튜토리얼이 끝이 났다. 기술 발전의 양면성에 대해 느낄 수 있는 시간이었다.
학술대회
-이미지/영상 데이터마이닝
해당 세션은 주로 이미지와 영상에 대한 세미나를 들을 수 있었다. 우리 연구실 박태남 연구원의 포즈인식 디퓨전 모델을 통한 가상 의상 착용 연구 발표도 매우 인상깊었는데, 기존 방법론으로는 사람의 포즈와 형태를 둘다 보존하기 어려운 문제점을 해결했다는 점이 기여점이었다. 또한 오수빈 연구원의 CCTV 영상에서 이상 스펙트럼을 감지하기 위해 준지도와 약지도 학습할 수 있는 지식 증류 기반의 아키텍쳐를 소개하였는데 지난 세미나때 지식증류기법에 대해 준비해본 내용이라 이해가 좀 더 잘 되었다.
- 의료/헬스케어 데이터마이닝
평소에 의료 분야에서 인공지능이 어떻게 사용되는지 흥미를 가지고 있었는데, 비단 의료 이미지 뿐만아니라 Chatbot을 통해 우울증 판단에도 적용될 수 있다는 점이 매우 흥미로웠다. 사용자의 발화를 분석해서 우울증 진단서 내에 필요한 항목을 자동으로 채우고, 우울증 관련 발화를 탐지하는 연구였는데, 성능이 괜찮게 나와서 앞으로 정신과 접근성이 낮아 잘 진단받지 못하는 사람들에게 도움이 될 수 있을 것 같다.
-최적화 및 강화학습 응용
이 세션에서는 우리 연구실 연구원이 두명이나 발표할 만큼 최근 많은 연구가 이루어지고 있는 분야다. 먼저 도메인 별 최대 손실 함수를 고려한 강건 최적화 기반 도메인 일반화 연구는 실제 데이터의 수집 환경이 다르더라도 그 일반화 성능이 잘 나타날 수 있도록 하는 연구였다. 그리고 역학 모델을 사용한 다중 에이전트 강화학습 연구는 에이전트와 환경의 상호작용으로 인한 역학적 변화를 잘 파악할 수 있도록 모델링하여 데이터의 효율성을 개선하는 연구였다.