- 2025년 9월 2일 오전 10:49
- 조회수: 17

[학회 후기]
25년 하계 데이터마이닝 학회가 평창 알펜시아 리조트에서 열렸다. 작년 경주에서 열렸던 데이터마이닝 학회와 마찬가지로 포스터 발표를 하게 되었다. 생각보다 많은 연구원들이 참여하여 컨퍼런스 홀이 좁지 않았음에도 불구하고 발표 세션에서는 발디딜 틈이 없을 정도로 붐볐다. 개인적으로는 대학원생으로서 마지막으로 참석하는 학회일 것 같은 생각이 들기도 하고, 마침 포스터 세션도 총 3시간으로 길어서 많은 학생들의 연구를 열심히 청취했다. 내가 전혀 생각지 못했던 분야에서도 인공지능을 활용하여 다양하게 연구가 진행되고 있었고, 나름대로 신선한 충격도 받고, 내가 진행하는 연구에서도 접목할 수 있는 아이디어도 얻을 수 있었던 의미있는 시간이었다.
[발표 후기]
주제: Dual Attention Recurrent neural network to predict molten steel temperature with converter continuity
제강 전로 조업은 철광석을 녹여 얻은 쇳물을 받아 산소와 여러가지 원료를 투입하여 깨끗하게 정련하는 공정으로, 복잡한 물리 화학 반응이 일어나는 공정이다. 이 때 전로에서는 후속 공정에 필요한 적정 온도를 확보해야하는데, 이 온도가 과도하게 높거나 낮으면 후속 공정의 원활한 진행과 제품 품질에 문제가 발생한다. 따라서 목표하는 온도가 주어졌을 때, 초기의 조건을 활용하여 미리 온도를 예측할 수 있다면, 전로에 투입되는 산소, 원료의 양을 최적화 할 수 있고, 온도 과부족에 따른 Risk도 최소화 할 수 있다. 본 연구에서는 쇳물의 최종 온도를 정확히 예측하기 위해, 매 전로 조업을 독립으로 가정하지 않고, 일련의 연속조업으로 간주하여 시계열 모델링을 진행하였다.
발표 주제 자체가 일반인들에게는 생소하기 때문에, 배경 설명에 시간을 많이 할애하였는데, 그 부분이 좀 힘들었던 것 같다. 그래도 많은 분들이 관심을 가져주셔서 즐거운 마음으로 발표했고, 1시간 30분이라는 시간이 짧게 느껴질 정도로 알찬 시간이었던 것 같다.
- 질문 1: 전로를 연속 시계열로 보셨다고 했는데, 이미 나와 있는 논문 중에는 그런 논문이 없나요?
- 답변 1: 네, 이런 철강 분야에서 인공지능을 접목한 논문 자체도 적고, 특히 전로 조업을 시계열로 간주하고 모델링 했다는 논문은 없었습니다.
- 질문 2: 시계열 가정으로 GRU를 쓰셨는데, 굳이 또 전로의 사용 횟수 정보를 Attention 해서 넣은 이유가 있나요?
- 답변 2: 처음에는 저도 GRU가 전로의 시계열적인 특성을 알아서 학습할 것이라 생각하고 모델링 했습니다만, 성능이 드라마틱하게 좋아지지 않아서 고민을 많이 했습니다. 그러다가 실제 조업에서도 매우 중요하게 생각하는 전로의 수명정보가 전혀 반영이 안되고 있다는 것을 발견하여, 이 정보를 임베딩하여 모델에 넣은 결과 만족할만한 성능향상이 있었습니다.
[청취 후기]
1. ReactionReasoner: Reasoning LLM for Chemical Reaction Prediction : 복잡한 화학 반응 (A분자 + B분자 = ?) 의 결과를 LLM으로 예측하는 연구를 제안, 기존에는 결과만 예측하였으나 LLM을 활용하여 왜 그런 결과가 나오는지까지 설명.
- 결과뿐 아니라 과정에 대한 것도 LLM으로 얻을 수 있다면, 아직 밝혀지지 않은 현상들도 밝힐 수 있는 실마리가 되지 않을까 하는 생각이 들었다.
2. Timing Matters : Designing When Students Should Teach AI in Programming : 초중고등학생들이 학습에 LLM을 굉장히 많이 사용하는데, LLM을 어떻게 사용해야 학습효과가 좋은지에 대한 연구를 진행. 코딩 문제가 주어지면, 문제정의->코드구조설계->코딩->디버깅 의 단계에서 각각 LLM의 도움을 받거나, 받지 않도록 하여 학습 효과를 점수로 측정함.
- 굉장히 신선하고 아이들을 위해 꼭 필요한 연구라는 생각이 들었다.
3. 편향 벡터 추출 및 편향 벡터 조정을 통한 범용적 언어 모델 편향 완화 프레임워크 : LLM이 편견을 가지고 있을 때, 그 편향된 벡터를 추출해내고 Adjust 하는 방법 자체가 간단하면서도 기발했다.