[학회 후기]
2024년 11월 22일과 23일에 경상북도 경주의 화백컨벤션센터에서 개최된 한국데이터마이닝학회 추계학술대회에 참가하였다. 이번 학회는 연구실에서 주최한 첫 학회이고, 전 인원이 함께 참여한 학회라 더욱 뜻 깊었다. 약 2~300명의 참가자가 있었을 만큼 규모가 컸고, 교수님들 위주 발표가 진행되어 높은 품질의 연구들을 살펴볼 수 있는 좋은 기회였다. 개인적으로는 3가지 역할로 학회에 참가하면서 새로운 경험들을 쌓을 수 있었다. 1) 선발대로 학회에 참가하였다. 학회 발표 외, 뒤에서 진행되는 전반적인 프로세스를 실제로 경험할 수 있었다. 2) 포스터 발표를 하였다. 첫 포스터 발표였으며, 의외로 구두발표만큼 힘들었고, 목 아팠다(?). 3) 구두발표 세션 2개(NLP/LLM & Real-World Applications of AI-2)의 좌장을 맡았다. 행사 진행과는 또 다른 느낌이었고, 처음으로 학술적인 자리에서 진행자를 경험했다. 개인적인 총평은 다음과 같다. 나쁘지 않았지만, 다음에는 조금 더 연구자스러운 자세로 임하고 싶다. 또한 조금 더 자신감있고, 또박또박 진행하고 싶다. 마지막으로, 지식을 더 쌓아서 유의미한 질문을 많이 하고 싶다.


[발표 후기]
주제: 반도체 웨이퍼 투과식 전자 현미경 이미지 내 노이즈 제거를 위한 Segment Anything 기반 가상 계측 레이블을 활용한 최적화
 - 이번 발표는 SK하이닉스와 함께한 2차년도 과제를 정리하여 발표하였다. 이는 노이즈 제거(denoising)에 목적을 두고 있으며, 일반적인 딥러닝이 아닌 최적화를 통해서 문제를 해결한다. 처음으로 포스터 발표를 해보았는데, 생각과는 달리 구두발표 만큼 어려웠다. 하지만, 계속 반복해서 말하다 보니 귀신같이 흐름이 정리되는 것 같아 신기했다. 이번 발표를 계기로 반복 및 검토의 중요성을 알 수 있었으며, 향후 논문을 작성하게 된다면 오늘 경험이 꽤 도움 될 것 같다. 

질문1: 본 방법론의 구체적인 목적이 무엇인가? 자동계측? 최적화? 노이즈 제거?
답변1: 본 방법론은 노이즈 제거를 최종 목표로 한다. “자동 계측을 위하여 최적화를 활용한 노이즈 제거 방법론”이라고 할 수 있겠다. (개인적으로 봐도, 제목이 다소 모호했던 것 같다. 향후 발표할 자리가 또 있다면, 조금 더 클리어하게 바꾸고 싶다.)


[청취 후기]
1. 한경식 교수(한양대학교 데이터사이언스학과): PREDICT: Multi-Agent-based Debate Simulation for Generalized Hate Speech Detection.
 - 굉장히 충격적인 발표였다. 나는 개인적으로 인간이 학습하는 과정을 모방한 연구에 늘 자극을 받는 것 같다. 이는 단순하게 모델이 예측하는 것이 아닌, 5개의 에이전트(토론자들)을 함께 학습하여 hate speech인지 아닌지 여부를 토론을 통해 결정한다. 사실 딥러닝은 명확한 hate speech와 non-hate speech에 대해서는 우수한 성능을 보인지 오래다. 하지만, 늘 애매모호한 문장에 어려움을 겪어 성능 저하가 발생한다. 본 연구는 이러한 “애매모호함”을 해결하게 해준 하나의 획기적인 방향이라고 생각한다.

2. 강석호 교수(성균관대학교 산업공학과): 약지도학습(Weakly-Supervised Learning)의 산업 응용 사례
 - 개인적으로 이처럼 labeled 데이터가 없거나 불완전한 상황에 대한 연구를 하고 있기에, 꽤나 재미있게 청취하였다. Segmentation task에서는 이러한 box나 scribble 형태의 약지도학습을 많이 보았는데, 단순한 분류문제에도 이러한 개념을 적용할 수 있다는 점이 새로웠다. 핵심은 "대략적인 레이블" 이다. 예를 들어, 144개 셀이 하나의 모듈을 이루는 상황에서 셀 단위 레이블이 어렵기에 모듈 단위 레이블을 활용하여 학습하거나, 원자 단위가 어렵기에 분자 단위 레이블을 활용하는 방식이다. 개인적으로는 이러한 대략적인 레이블이 노이즈가 되지 않을까라는 걱정도 되었으며, 노이즈를 최소화하면서, 레이블을 대략적으로 정의하는 노하우가 궁금했다.

3. 강지훈 교수(한국공학대학교 경영학과): Physics-informed Machine Learning for Engineering Applications
 - 인공지능 모형에 물리학 법칙을 함께 적용하여 성능을 개선한 연구이다. 여러 사례를 소개해주었는데, 개인적으로는 super-resolution task에 기후 도메인에서 많이 활용되는  방정식을 도입한 것이 인상깊었다. 결국 인공지능은 현실에 주어진 어떤 문제를 해결하기 위한 하나의 도구인데, 이때 도메인에 적합한 물리학 지식을 함께 활용하는 것의 효과를 체감할 수 있었다. 추가적으로, 이러한 물리학 식을 함께 적용함으로써, 딥러닝의 단점인 블랙박스 문제를 해결할 수 있는 측면 또한 인상 깊었다.