영국 데이터복제 솔루션 기업 웬디스코는 국내 주요 병원, 기업, 대학, 연구기관의 생명 공학 연구자들에게 유전체 정보 분석 플랫폼을 무료 제공하고 있는 한국생명공학연구원 국가생명연구자원정보센터(KOBIC)에 데이터복제 소프트웨어를 기증했다고 22일 밝혔다.
KOBIC은 작년 3월부터 세계 코로나19 관련 유전체와 단백체 데이터를 수집해 정보를 제공하는 '코로나19 연구정보 포털'을 운영해 왔다. 이후 급증한 사용자로 인해 '바이오익스프레스'의 데이터 처리 성능에 문제가 생겼다. 이는 자체 구축한 빅데이터 플랫폼에서 운영되는 대용량 유전체 분석용 클라우드 서비스다. 이 서비스의 고속 데이터 분석시 하둡 기반 분산파일시스템(HDFS)과 리눅스·유닉스 기반 러스터 파일시스템 간 대용량 데이터의 양방향 복제에 많은 시간이 소요됐다. 일평균 약 20TB 규모의 데이터 복제가 발생해 전체 처리시간의 40%이상을 차지했다.
웬디스코는 작년 1분기 연구 기관을 대상으로 '라이브 데이터 플레인(Live Data Plane)' 솔루션 무료 기증 방침을 발표하고 이후 KOBIC에도 라이브 데이터 플레인을 무상 제공하겠다고 제안했다. 라이브 데이터 플레인은 데이터 가용성과 일관성을 보장하면서 대용량 데이터 복제시간을 단축할 수 있는 데이터복제 솔루션이다. KOBIC은 작년 하반기 이 솔루션을 적용해 빅데이터 플랫폼의 고속 복제 환경을 구현했고, 올해 오픈할 차세대 바이오익스프레스에 이를 적용할 계획이다. KOBIC은 바이오익스프레스 서비스를 이용한 대용량 유전체 분석 효율을 크게 높일 것으로 기대하고 있다.
백지훈 웬디스코 한국지사장은 "한국의 경우 KOBIC의 아키텍처 개선을 위해 키이스 그래함(Keith Graham) 글로벌 세일즈 선임부사장이 영구 라이선스 기증과 함께 본사 및 현지 인력까지 특별히 추가로 무상 지원해 KOBIC의 차세대 바이오 익스프레스 환경에 맞게 데이터 복제 방식을 적용했다"고 말했다.
고건환 KOBIC 전산개발팀 연구원은 "KOBIC은 웬디스코 라이브 데이터 플랫폼을 하둡 기반 분석 클러스터와 리눅스 기반 분석 클러스터 간 복제에 활용함으로써 기존보다 13배 빠른 파일 복제을 할 수 있게 됐고, 바이오익스프레스 서비스의 전체 평균 분석 시간을 30% 이상 단축할 수 있었다"고 말했다.
KOBIC은 작년 3월부터 세계 코로나19 관련 유전체와 단백체 데이터를 수집해 정보를 제공하는 '코로나19 연구정보 포털'을 운영해 왔다. 이후 급증한 사용자로 인해 '바이오익스프레스'의 데이터 처리 성능에 문제가 생겼다. 이는 자체 구축한 빅데이터 플랫폼에서 운영되는 대용량 유전체 분석용 클라우드 서비스다. 이 서비스의 고속 데이터 분석시 하둡 기반 분산파일시스템(HDFS)과 리눅스·유닉스 기반 러스터 파일시스템 간 대용량 데이터의 양방향 복제에 많은 시간이 소요됐다. 일평균 약 20TB 규모의 데이터 복제가 발생해 전체 처리시간의 40%이상을 차지했다.
웬디스코는 작년 1분기 연구 기관을 대상으로 '라이브 데이터 플레인(Live Data Plane)' 솔루션 무료 기증 방침을 발표하고 이후 KOBIC에도 라이브 데이터 플레인을 무상 제공하겠다고 제안했다. 라이브 데이터 플레인은 데이터 가용성과 일관성을 보장하면서 대용량 데이터 복제시간을 단축할 수 있는 데이터복제 솔루션이다. KOBIC은 작년 하반기 이 솔루션을 적용해 빅데이터 플랫폼의 고속 복제 환경을 구현했고, 올해 오픈할 차세대 바이오익스프레스에 이를 적용할 계획이다. KOBIC은 바이오익스프레스 서비스를 이용한 대용량 유전체 분석 효율을 크게 높일 것으로 기대하고 있다.
백지훈 웬디스코 한국지사장은 "한국의 경우 KOBIC의 아키텍처 개선을 위해 키이스 그래함(Keith Graham) 글로벌 세일즈 선임부사장이 영구 라이선스 기증과 함께 본사 및 현지 인력까지 특별히 추가로 무상 지원해 KOBIC의 차세대 바이오 익스프레스 환경에 맞게 데이터 복제 방식을 적용했다"고 말했다.