- 2024년 11월 24일 오후 8:34
- 조회수: 342

[학회 후기]
2024년 11월 22~23일 경주 화백컨벤션센터에서 개최된 한국데이터마이닝학회 추계학술대회에 참가하였다. 처음으로 연구실 대부분의 인원들과 함께 지방 학회를 다녀온 것 뿐만 아니라 첫 포스터 발표였기 때문에 보다 의미 있었던 학회였다. 그리고 처음으로 학회 데스크 업무도 했을 뿐만 아니라 전혀 기대하지 못했던 수상까지 하게 되어, 나중에도 많은 기억이 남는 학회가 될 것 같다.
[발표 후기]
주제: 불확실성 기반 샘플 의존적 노이즈 레이블 생성 방법론
저번 대한산업공학회에서 발표한 내용에 추가적으로 수행했던 내용을 덧붙여서 포스터를 만들었다. 항상 발표를 하게 되면, 내가 발표를 쭉 진행한 후에 그에 대한 질의응답을 진행했었는데, 여러 번 반복적으로 내 연구를 엔드투엔드로 설명한 것은 처음이였다. 같은 내용을 말하다 보니 두 세번 이후 부터는 보다 정리된 상태로 키 포인트를 잘 말할 수 있게 됐던 것 같다. 설명을 해줄 때 이해하는 듯한 리액션이 나오면 살짝 마음이 놓이기도 하고 뿌듯한 마음이 들기도 했던 기억이다. 또한, 질의응답을 진행하면서 내가 놓쳤던 부분들도 다시 돌아볼 수 있었다.
- 질문 1: 노이즈 레이블 데이터셋을 생성한 후, 기존 노이즈 레이블 러닝 알고리즘으로 실험을 할 때, 제안 방법론 데이터셋에서 성능이 안좋은게 맞지 않을까요? 그 만큼, 현실적이고 어려운 노이즈 레이블 상황이기 때문에 이러한 관점도 생각해보면 좋을 것 같습니다.
- 답변: 그러한 관점에서는 생각해보지 못한 것 같습니다. 그 부분도 타당한 것 같고, 향후 계획에 대해서는 보다 고민을 해야할 것 같습니다.
[청취 후기]
여러 교수님들의 발표를 듣게 됐었는데, 정말 다양한 분야가 존재하고 내가 아예 몰랐던 분야들도 아직 많다는 것을 다시 한 번 깨닫게 되었다.
1. PREDICT: Multi-Agent-based Debate Simulation for Generalized Hate Speech Detection (한양대학교 데이터사이언스학과 한경식 교수님)
우선 이 발표를 통해 Hate Speech Detection이라는 분야를 처음 접하게 되었다. 크게 보면, text classification이라고 볼 수 있을 것 같고, 가짜 뉴스 판별기와 같은 종류라고 이해하였다. hate speech 라는 것은 사람이 판단하기에 그 주관이 많이 개입될 수 밖에 없다. 누구한테는 심한 말이, 다른 사람한테는 대수롭지 않게 여겨질 수도 있는 것처럼 말이다. 이러한 주관에 의한 문제를 줄이기 위해 5개의 LLM 에이전트를 도입을 하였고, 이 5개의 에이전트끼리 논쟁을 하도록 하는 것이 매우 흥미로웠다. 그리고 debate 후에는, 따로 설정한 judge LLM 에이전트가 해당 text가 hate speech인지 아닌지를 판단하게 된다. 다만, debate하는 과정이 고정된 값으로 설정되는 것으로 이해를 하였는데, 각 text마다 프롬프트 등을 활용하여 judge 에이전트가 debate하는 횟수를 dynamic하게 조정할 수 있다면 좋지 않을까 생각이 들었다. 각 text마다 hate speech 여부에 대해 판단하는 난이도가 다를 것이기 때문이다.
2. 특별 세션 - 신임 교원 패널 세션
신임 교수님들을 패널로 모시고 청중들의 질문들에 답변을 해주시는 시간이였다. 학회에서는 이러한 세션이 처음이라 신기하기도 했고 개인적으로는 매우 흥미롭고 유의미한 시간이였던 것 같다. 대부분의 질문은 신임 교수님들의 경험들에 대한 질문이였다. 교수님이 되시고 가장 힘든 점은 무엇인지, 준비할 때 가장 어려웠던 점은 무엇인지, 어렸을 때부터 꿈이 교수님이셨는지 등 많은 질의응답들이 오갔다. 개인적으로는 UNIST 이연창 교수님께서 말씀하신 제안서에 대한 경험이 제일 기억에 남는다. 앞으로도 제안서 작업을 할 일이 많이 있겠지만, 늘 좋은 경험이라고 생각하고 최선을 다해야겠다고 생각했다. 본인들의 소중한 경험들을 공유해주신 신임 교수님들께 다시금 감사의 인사를 전하고 싶다.