- 2019년 8월 13일 오후 1:05
- 조회수: 1635
김성범 교수님
이번 KDD (Knowledge Discovery and Data Mining) 학회는 미국 알래스카 앵커리지에서 개최되었다. 미국 50개 주 중 49번째로 편입된 알래스카는 1867년 크림 전쟁에서의 패배로 인해 재정난에 빠진 러시아 제국으로부터 미국이 미화 720만 달러를 주고 샀다고 한다. 720만 달러(약 88억 원)면 화폐 가치 상승을 고려하더라도 헐값이 아닐 수 없다. 알래스카의 8월은 그야말로 완벽한 날씨다. 기온이 15도~25도로 아침에는 약간 선선하고 낮에는 따뜻한 정도. 밤 11시가 돼서야 해가 지고 오전 5시면 해가 뜨는 백야현상도 볼 수 있어 밤을 싫어하는 나에게는 정말 이상적인 곳이었다.
1. 뉴럴네트워크로 거의 도배를 하고 있는 ICML, NerulPS와는 달리 KDD는 데이터마이닝, 머신러닝, 인공지능 분야 다양한 주제를 고루 다루는 학회이다. 또한 새로운 이론이나 방법론에 대한 소개뿐 아니라 여러 가지 응용 분야의 발표도 많아 학계와 산업체의 참가자가 고루고루 모이는 학회로 유명하다. KDD 주최 측에서는 이번 학회 핵심 주제 (Theme)를 다음 3가지로 잡았다. Earth, Deep Learning, Health.
2. 나에게 이번 학회의 키워드를 하나만 꼽으라면 Generalized learning이라고 하고 싶다. Generalized learning은 그 의미를 담아 내가 만든 용어다. 딥러닝 기술의 눈부신 발달로 한가지 혹은 적은 수의 태스크에 대한 수행 정확도는 만족할 만한 수준에 이르렀지만 이를 위한 필수 조건은 다양하고 충분한 양의 데이터 확보이다. 하지만 현실에서는 데이터가 충분히 쌓여 있지 않은 경우가 많다. 즉, 충분한 양의 데이터가 없을 때도 만족할 만한 수준의 성능을 내기 위한 머신러닝 기술을 통칭해서 Generalized learning이라고 정의한다. 인간이 특정 문제를 인식하고 해결하는 과정은 해당 문제만의 경험을 통해 100% 이루어지는 것은 아니다. 예를 들어, 인간이 호랑이와 사자를 구별하는 것이 반드시 그것들을 많이 보아서 가능한 것이 아니라 일반적으로 서로 다른 사물들을 구별하면서 생긴 능력을 통해서 가능한 것이다 (사실 우리가 살면서 호랑이와 사자를 몇 번이나 봤는가?). 따라서 호랑이와 사자를 구별하는 머신러닝 모델도 해당 이미지를 통해서만 구축하는 것이 아니라 일반적인 이미지 분류 능력을 키워 줌으로 가능하게 만들자는 것이다. 그간 정확한 머신러닝 모델 구축을 위해서는 방대한 양의 데이터가 꼭 필요하다고 생각했는데 이를 보완하고 해결하자는 노력이다. Generalized learning에는 Transfer learning, Multi-task learning, Meta learning, Semi-supervise learning등이 포함될 수 있을 것이다.
3. Generalized learning 외에도 Graph neural networks, Language modeling, Embeddings, Multivariate time-series modeling 등의 주제들도 활발하게 연구되고 있었다.
4. 학회의 스케일이 참 크다는 생각이다. 학회 기간 중 Earth Day에 AI for Earth라는 주제로 머신러닝을 이용하여 지구를 보존할 수 있는 방안에 대한 발표가 있었다. NASA에서 운영하고 있는 NEX (NASA Earth Exchange)에 다양한 인공위성, 기후, 농업정보, 자연재해 등의 정보가 담겨 있는 것을 알았다. 최근 우리 연구실에서 시작한 “드론 이미지를 통한 농작물 수확량 예측” 프로젝트가 새삼 의미 있게 생각되었다. 이 주제와 관련하여 인상 깊게 들었던 또 하나의 발표는 마이크로소프트(Microsoft)에서 수행하고 있는 “머신러닝을 이용한 코뿔소 밀렵 행위 탐지 (Preventing Rhino Poaching through Machine Learning)” 문제였다. 코뿔소의 뿔은 수억 원에 달하고 있기 때문에 밀렵꾼들의 끊임없는 목표물이 되고 있고 이 때문에 아프리카에서는 하루 평균 3마리의 코뿔소가 희생되고 있다고 한다. 이를 방지하기 위해 코뿔소 출몰지에서 찍은 주/야간 카메라 이미지를 Object detection과 Image segmentation기법을 사용해 분석하고 이를 통해 밀렵행위를 탐지한다는 내용이었다. 마이크로소프트에서 이런 주제의 연구를 한다는 것이 놀라울 따름이다. 돈을 벌기 위해 인공지능을 연구하는 나라. 지구를 살리기 위해 인공지능을 연구하는 나라. 비교 자체가 불가능하다는 생각이다.
5. 이번 학회에서 새삼 느낀 점은 다양성이다. 세계 각지에서 온 참가자들이 영어라는 공통언어를 쓰고 있지만, 특유의 억양이 어울려 마치 만국 박람회에 온 느낌이었다. 정확한 수치는 모르겠지만 여성 참가자 수도 꽤 많았다. 에어비엔비(Airbnb)에서 데이터사이언스 그룹장을 역임했던 Elena Tej Grewal의 발표는 매우 인상적이었다. 최고의 팀을 구축하기 위해 그녀가 강조한 첫 번째 항목은 팀원들의 다양성이었다고 한다. 우리 연구실을 최고로 만들기 위해 내가 어떻게 행동해야 하는지 생각해 볼 수 있는 시간이었다.
6. 이번 학회 역시 개최도시에 있는 대표적인 대학인 University of Alaska at Anchorage (UAA)를 방문하였다. 방학 기간이라 그런지 캠퍼스가 한가하고 차분하였다. 도서관, 체육관, 학생회관 등을 둘러보았다. 넓은 캠퍼스, 그리고 넓은 녹지. 전형적인 미국의 대학 캠퍼스였다. 좋은 날씨에 캠퍼스 곳곳을 걸어 다니며 반나절을 보냈다. 더도 말고 한 달만 이곳에서 지내며 논문만 실컷 읽고 싶은 마음이 들었다.