[학회 후기]
이번 2024년 춘계 한국데이터마이닝학회는 양재 엘타워에서 열렸다. 지난 23년 추계학회에 이어 다시 한 번 청취자로 참가하였다. 학회에 참석하여 다양한 연구들을 직접 청취해보는 것은 정말 값지고 훌륭한 경험인 것 같다. 데이터 컨퍼런스는 최근 가장 핫하게 다루어지고 있는 생성형AI에 대한 내용이 주를 이루었으며, 논문 세션에서는 주로 제조, 의료 등 산업 현장에 인공지능을 적용하기 위해 진행된 연구과 자연어/언어모델에 대한 연구들이 주를 이루었다. 개인적인 관심분야인 이미지/영상처리와 산업인공지능 응용분야 세션을 위주로 청취하였는데 같은 시간에 진행된 언어모델이나 의료/헬스케어 세션의 발표들을 듣지 못한 점은 아쉬웠다. 많은 연구자들이 문제상황 해결을 위해 치열하게 고민한 흔적들을 훌륭하게 정리하여 발표하는 내용들을 보면서 많은 자극을 받을 수 있는 귀중한 시간이었다.

[청취 후기]
1. TA-Net: Tri-Aspect Network for Camouflaged Object Detection (A-11)
학회 첫 세션에서 청취한 'TA-Net'에 대한 연구가 굉장히 흥미로웠다. 내 연구와 비슷한 관점을 가지면서도 결과적으로는 다른 방식으로 문제를 해결해서 더욱 그렇게 느껴졌다. COD(Camouflaged Object Detection) 는 위장된 물체를 식별하는 기술이다. 본 연구에서는 성능 향상을 위해 기존의 단일 네트워크 기반 접근방식에 더해 독립적으로 최적화된 세 가지 네트워크를 추가하여 결과를 도출해냈다. 세가지 네트워크는 각각 경계, 색상, 질감의 특성을 추출하는 데 최적화 되어있다. Edge Network는 Sobel 필터를 사용하여 경계를 강화했고, Color Network는 RGB에서 HSV로 변환하여 색상 차이를 강조했으며, Texture Network는 Bayar Convolution을 활용하여 질감의 차이를 탐지했다. 기존 방법론 대비 성능이 상승했다는 성과가 있었지만 후속 질의응답 단계에서 언급되었던 대로, 모델의 규모가 커서 cost 관점에서는 좀 더 개선이 필요하다는 한계점도 갖는 되는 연구였다. object detection/segmentation 분야를 연구해보면서 느낀 가장 중요한 점은 단순히 딥러닝 모델만을 사용하여 접근하는 것 만으로는 원하는 결과를 얻는 것에 분명 한계가 있다는 것이다. 특히 연구에 주로 사용되는 데이터셋이 아니라 현업의 다양한 데이터에 적용을 할 경우 그 한계는 더 크게 다가온다. 반드시 데이터의 특징을 반영할수 있는 맞춤형 기법들이 함께 반영되어야 한다고 생각하며, 이 연구는 그 점을 반영하기 위한 시도를 했다는 점을 높이 사고 싶다. 

2. 마스킹 기반 지도 학습을 활용한 RGB-D 중요 물체 검출 (A-14)
이 연구는 SOD(Salient Object Detection / 중요 물체 검출) 를 위해 RGB 이미지 뿐만 아니라 깊이(depth) 이미지를 함께 활용하는 접근 방식을 제안했다. 또한 충분하지 않은 학습 데이터로 인해 이미지 내 맥락 이해에 한계가 존재하는 문제를 해결하기 위해 마스킹 기반 지도 학습 프레임워크를 사용한 점이 돋보였다. 기존의 SOD 모델들이 이미지 내 맥락을 충분히 이해하지 못하는 한계를 극복하기 위해, 샴 구조의 네트워크를 기반으로 하며, 모델의 구조적 변형 없이 추가적인 마스킹 된 입력 값을 통해 지역적 맥락과 전역적 맥락을 학습할 수 있도록 프레임워크를 설계했다. 학습 데이터가 부족한 상황에서도 성능을 향상시킨 점과, 학습 과정에만 적용되기 때문에 추론 시에는 추가 비용 없이 기존 모델과 동일한 추론 과정을 거쳐 효율성을 유지하는 점은 장점이지만 모델측면의 경량화를 통해 학습시간의 증가 문제를 해결할 수 있는 방법을 찾느다면 그 활용도가 더 높아질 것 같다.

3. Deep Contrastive Matching for Printed Circuit Board Defect Classification (B-15)
이 연구는 인쇄 회로 기판(PCB) 을 검사하는 과정에서 전통적 이미지 전처리 기법 대신 딥러닝을 이용하는 방법을 제안했다. 기존의 전처리 기반 방법들이 결함의 위치정보를 잃어버리는 문제점을 해결하기 위해 딥러닝 기반 대조 매칭 방법을 도입했다. 딥러닝 모델 내에서 검사 이미지와 참조 이미지의 특징 맵의 차이를 통해 결함 정보를 추출하고 어텐션 맵으로 결함부위를 강조하는 방법을 제안하였으며, 특히 학습 시 대조 손실함수를 적용하여 불필요한 정보를 최소화하고 결함을 강조함으로써 대조 매칭 방법의 효과를 극대화하였다. 도메인은 다르지만 반도체 검사공정에서도 참조 이미지와의 불량 이미지간의 비교를 통해 불량여부를 판단하는 방법이 사용되기 때문에 더 흥미가 생겼다. 내가 경험한 현업에서는 참조 이미지와 불량 이미지가 완벽하게 같은 위치를 촬영한 것이 아니기 때문에 둘을 정렬을 하는 과정에서 문제가 생기곤 했다. 보통 기준점을 두고 두 이미지를 매칭을 하는 방식을 사용하곤 하는데 딥러닝기반의 방식을 적용한다면 그런 불합리가 어느정도 해소될 것이라 생각되며, 향후 현업에서 문제상황을 대할 때 접근법을 달리 해볼 여지가 있을 것 같다. 본 연구에서 역시 불량과 참조데이터의 획득과정까지 좀 더 디테일하게 다룬다면 연구가 좀 더 풍성해지고 실제 현장에 적용함에 있어도 더 좋은 성능을 내는 데 도움이 될 수 있지 않을까 라는 생각도 들었다.


마지막으로, 이번 학회를 진행하기 위해 고생하신 교수님과 조교 및 스태프 연구원들의 고생 덕분에 정말 의미있는 시간을 보낼 수 있었던 것 같습니다. 고맙습니다.