- 2024년 11월 24일 오후 10:02
- 조회수: 410

2024년 11월 22일부터 23일까지 경주에서 열린 2024 한국데이터마이닝학회 추계학술대회에 참석했다. 이번 학회에서 처음으로 포스터 발표를 경험하며, 다른 연구자들과 편하게 소통할 수 있어 매우 뜻깊은 시간이었다. 또한, 연구실 모든 구성원이 함께 참석해 식사를 나누고 추억을 쌓으며 즐거운 시간을 보낼 수 있었다.
[발표 후기 – 트랜스포머 기반 장기 의류 판매량 예측]
이번 학회 포스터 발표 세션에서는 한세실업과 진행한 프로젝트를 발전시킨 트랜스포머 기반 장기 의류 판매량 예측 모델을 주제로 발표하였다. 해당 방법론은 의류 상품에서 나타나는 반복적인 패턴, 추세, 급격한 변동성 그리고 장기 예측의 필요성을 반영하였다. 일반적인 발표와 다르게 청취자들과 자유롭게 소통하고, 내 연구를 소개할 수 있어 좋았다. 또한 내가 진행한 연구를 다른 사람들이 궁금해하는 것을 피부로 느낄 수 있어 뿌듯하였고, 다양한 질문들을 받으면서 내가 이전에 생각해보지 못했던 부분들에 대해 고민할 수 있었다.
질문1: 디노이징 오토인코더를 사용하면 어떤 장점이 있으며, 해당 디노이징 오토인코더의 특징이 있는지?
답변1: 디노이징 오토인코더를 사용한 이유는 입력 데이터를 스무딩(smoothing)하기 위함이다. 이때 일반적인 방식과는 다르게 슬라이딩 윈도우(sliding window)내 입력 데이터 크기를 고려해 노이즈를 주입하였고, 스무딩한 입력 데이터를 바탕으로 예측 모델이 판매량 추세를 효과적으로 학습하고자 하였다.
질문2: 해당 방법론의 한계점은 무엇이라 생각하는지?
답변2: 개인적으로 판매량 데이터 이외 다른 변수들을 고려하지 못한 것이라고 생각한다. 다만 우리는 실제 현업에서 경제 지표, 날씨 등과 같은 추가 변수들의 확보가 어려울 것으로 생각해 판매량 데이터만으로도 좋은 성능을 보이는 예측 모델을 구축하고자 하였다.
질문 2를 주신 교수님께서 방법론의 장점을 강조하는 것도 중요하지만, 향후 연구를 발전시키기 위해서는 단점을 충분히 고민하는 것이 필요하다는 피드백을 주셨다. 이 피드백을 통해, 앞으로 데이터 분석가로서 연구를 진행할 때 단점을 면밀히 검토하고, 다양한 관점에서 내 방법론을 바라보는 태도가 중요하다는 점을 다시 한번 깨닫게 되었다.
[청취 후기]
1. “고객 리뷰 데이터를 활용한 Unique Selling Point 검증 및 탐색 프레임워크 – 서울대학교 강필성 교수님”
USP(Unique Selling Point)란 제품이 갖는 대중의 관심, 경쟁사 대비 장점 및 혜택 등을 의미한다. 기존 USP 탐색은 주로 인터뷰를 통해 진행되어 bias가 생기면서 실제와는 다른 USP를 찾게 될 수도 있다는 단점이 존재한다. 따라서 객관적인 USP 탐색을 위해 사용자 반응에 토픽 모델링을 적용해 우수한 성능을 달성함은 물론 해석력 또한 갖췄다고 한다. 강필성 교수님의 명강의 덕분에 익숙하지 않은 언어 모델임에도 흥미롭게 청취할 수 있었다. 개인적으로 언어 모델의 활용 분야가 정말 다양하고 많은 기업에서 필요로 하는 기술이라는 것을 체감할 수 있었다.
2. “반도체 제조 현장에 지능형 이미지 분류 AI system 적용을 통한 생산 품질 업무 경쟁력 강화 – SK 하이닉스 김문욱 파트장님”
다양한 기업에서 공정 자동화 및 스마트 팩토리를 위해 인공지능 모델을 도입하고 있는 추세이다. SK 하이닉스 반도체 판정 업무를 대신하는 이미지 분류 AI 모델을 적용하고 있다고 한다. 이때 개발자 수는 한정적이라 매번 모델을 튜닝하고, 새로운 문제와 데이터에 맞추기는 어렵다고 한다. 따라서 비전문가도 단순하게 클릭(click)만으로도 모델을 만들 수 있는 MLOps를 개발하였다고 한다. 현재 많은 기업이 MLops에 큰 관심을 보이고 있으며, 개발자 뿐만 아니라 모든 직원이 손쉽게 AI 모델을 만들어 활용할 수 있는 시스템의 중요성이 점점 더 부각되고 있는 것 같다.
3. “AI 생성 이미지가 정치 뉴스 인식 및 이해에 미치는 영향 – 한양대학교 손비진님”
정치나 뉴스는 사람들에게 필요한 정보를 전달하는 중요한 수단이며, 기사의 목적이나, 보도 방식에 따라 사용되는 이미지가 달라지게 된다. 이에 해당 연구는 뉴스 기사들에 실린 내용과 이미지를 분석하고, 기사들의 핵심 내용을 입력해 이미지 생성 모델인 스테이블 디퓨젼을 통해 이미지를 생성하였다. 생성된 이미지를 분석한 결과 사실 기반 기사는 실제 사진과 유사한 이미지를 생성하였으나, 편향이 개입된 기사는 가사의 목적에 맞게 실제 사진과는 다른 색체가 적용된 이미지가 생성되었다고 한다. 개인적으로 기사에서 드러나는 편향이 생성 모델이 만들어내는 이미지에도 드러난다는 것이 매우 흥미로웠다.
마지막으로 이번 2024년 한국데이터마이닝 추계학술대회를 훌륭하게 준비해준 동료 연구원들에게 감사하다는 인사를 전하며 후기를 마친다.