- 발표자 후기

제목 : Conflict Graphical Model of Feature Selection

발표 요약 : mixed integer program과 conflict graph를 활용한 regression 모델에 대한 발표를 진행했다. 이 모델은 변수 간의 상관관계가 크게 존재하여 multicollinearity를 야기하는 경우, regression error를 크게 손해보지 않으면서 multicollinearity도 제거할 수 있는 장점이 있다. 하지만 정수 계획법이 풀이 시간이 오래 걸린다는 단점이 있는데 이를 보완하기 위해 Clique Constraint를 식에 삽입하여 정수계획법의 풀이 시간을 단축하는 방법에 관한 연구도 진행하였다. 제안 모델의 성능을 검증하기 위해 몇 가지 실험을 진행하고 결과를 보고하였고, 향후에는 regression error bound에 관한 연구도 추가로 진행할 예정이다.

질문 및 답변

(1) Integer programming을 풀 때 변수의 개수가 늘어날 경우 풀이 시간이 기하 급수적으로 늘어날 것 같은데 이를 어떻게 해결할 수 있나?

MIT의 Bertimas 교수의 말을 빌리자면, 최근 정수계획법을 해결하는 소프트웨어의 속도와 이를 처리하는 하드웨어의 속도가 크게 개선되어, 일반적으로 변수선택이 적용되는 사이즈의 문제는 쉽게 해결할 수 있다. 좀 더 큰 사이즈의 문제에 대해서는 심층적인 연구가 필요할 것 같다.

(2) Clique를 partition하는 문제도 NP-Hard 문제인데 해당 문제를 해결해서 제약식을 만들겠다는 게 배보다 배꼽이 더 큰 것은 아닌가?

맞는 말이다. Clique Partition도 NP-Hard 문제에 속하는 것으로 이론적으로 어려운 문제이다. 하지만 완벽한 최적의 Partition은 아니더라도 어느 정도 좋은 해를 찾아주는 알고리즘들이 많이 제안되어 있다. 이것들을 사용한다면 크게 문제가 되지는 않을 것 같다.

(3) CGCF 알고리즘에서 커버가 된 노드들 중에서 어떤 변수가 선택되는 것인가?

그것은 데이터들 마다 특성이 다르기 때문에 어떤 변수가 선택된다는 것을 그래프 구조상에서 판단하기는 어렵다. 실제 상황에서는 regression error를 가장 줄여주는 변수가 선택될 것이다.

(4) Collinearity가 있는 상황에서 사용하는 모델들이 통계학 쪽에서 많이 제안되어 있는데 공부를 해보면 연구에 도움이 될 것 같다. 커버가 된 변수들 중에서 하나를 선택할 수도 있지만 평균을 취함으로서 정보 손실을 줄일 수 있는 방법도 있다.

느낀점

좋은 질문과 코멘트를 얻을 수 있는 귀중한 시간이었다. 앞으로 연구를 계속 진행함에 있어서 발표 당일 나왔던 질문과 코멘트들을 고려하면서 좀 더 좋은 연구를 할 수 있도록 노력할 것이다. 그리고 지속적으로 해당 분야에 대한 공부를 게을리 하지 않을 것이다.


- 학회 후기

이번 학회에서는 기조 연설을 비롯해서 좋은 연구들이 많이 발표되었다. 기조 연설에서는 베이지안 통계를 기반으로 한 추천 시스템을 발표했다. 여기서 재미있는 부분이 있었는데, 추천 시스템을 구성하는 핵심이 matrix factorization에 기반하고 있고 이 과정에서 regularization이 이용되고 있다는 점이었다. Regression 뿐만 아니라 matrix factorization 분야에 대한 regularization도 좀 더 공부해봐야 겠다는 생각을 하게 되었다. 그리고 베이지안 통계학도 좀 더 공부를 해두면 학문적으로도 실용적으로도 사용할 수 있는 부분이 많을 것이란 생각을 했다. 현실적으로 알기 어려운 복잡한 분포에 대한 추정을 효율적으로 할 수 있기 때문에 앞으로 많은 사용이 예상된다.

다음으로는 신현정 교수님이 발표한 발표가 인상 깊었다. 질병의 지도를 그리는 것인데 유전자와 단백질 그리고 질병을 연결하는 네트워크를 구성함으로서 유전학과 의학을 연결하는 교두보 역할을 하는 연구였다. 연구 방법도 참신하고 좋았지만 주제도 굉장히 의의가 큰 연구였다. 그러나 발표 슬라이드를 200장이나 준비해 와서 모두 다 발표하는 것은 옳지 못한 태도였던 것 같다. 타산지석으로 삼아 앞으로 나는 지양해야 할 태도같다.