사회연결망, 단백질구조 분석 등 다양한 영역에서 활용될 것으로 기대

김상욱 교수
김상욱 교수

[한국대학신문 이하은 기자] 김상욱 한양대학교 컴퓨터소프트웨어학부 교수팀은 최근 그래프 빅데이터의 분석성능을 기존 대비 최대 40배 이상 빨라진 싱글머신 기반 그래프엔진 ‘리얼 그래프(RealGraph)’를 개발했다고 14일 밝혔다.

리얼 그래프란 기존의 수십‧수백대의 컴퓨터로 구성된 분산 클러스터 기반 그래프 엔진이 처리하던 작업을 단 한 대의 컴퓨터가 처리할 수 있도록 하는 새로운 방식의 그래프 엔진을 말한다. 

그래프는 객체들과 이들 간의 관계들을 표현하는 데이터 구조다. 페이스북‧인스타그램 등의 사회연결망, 그리고 뉴런‧단백질 구조‧도로망 등은 이러한 그래프로 표현되는 대표적 빅데이터다. 이러한 그래프 빅데이터를 분석하면 비즈니스와 과학기술에서 활용할 수 있는 유용한 지식을 추출해 낼 수 있다는 장점이 있다. 

김 교수팀은 리얼 그래프를 설계하는 과정에서 ‘현실 세계의 그래프 데이터는 정규분포가 아닌 멱급수법칙 분포(power-law degree distribution)를 보인다’는 특징을 반영했다. 인스타그램 등의 사회연결망에서 대부분의 사용자들은 소수의 사용자들과만 관계를 맺는데 반해, 극소수의 사용자들은 수많은 사용자들과 관계를 맺는 것이 대표적인 멱급수법칙의 예다.

기존 그래프 엔진들은 이러한 멱급수법칙 분포를 보이는 특성을 고려하지 않았고, 이로 인해 작업량 불균등분배와 비효율적인 메모리 접근을 일으켰다.
  
김 교수팀은 이런 문제를 해결할 수 있는 새로운 전략들을 반영했고, 그 결과 리얼 그래프는 대용량 그래프 빅데이터 처리 시 기존보다 최대 44배 빠른 성능을 보였다. 향후 리얼 그래프는 사회연결망 분석, 단백질 구조 분석 등 그래프 빅데이터의 빠른 분석을 위해 다양한 영역에서 활용될 것으로 기대된다. 

한편 김 교수팀의 리얼 그래프 연구는 한국연구재단의 연구비 지원을 받아 진행됐으며 조용연 박사, 장명환 연구원, 그리고 박선주 연세대 교수가 개발에 함께 참여했다. 리얼 그래프의 아이디어는 학술적으로도 크게 인정받아 15일(현지시간) 미국 샌프란시스코에서 열리는 ‘더 웹 콘퍼런스(The Web Conference 2019)’에서 발표될 예정이다.

저작권자 © 한국대학신문 무단전재 및 재배포 금지