서울대, 빅데이터 분석용 무상 통계 프로그램 개발
2013-09-25 11:31
데이터과학과지식창출연구센터, SRC-STAT 보급 나서
이영조 교수 |
미래창조과학부는 서울대 데이터과학과지식창출연구센터가 빅데이터 분석이 가능한 통계 패키지 SRC-STAT를 개발했다고 25일 밝혔다.
이번 성과는 미래부와 한국연구재단이 추진하는 선도연구센터지원사업의 지원 및 에스이랩과 서울대학교 빅데이터센터 등의 후원으로 수행됐다.
센터는 개발한 통계 패키지를 국내 교육기관에서 사용할 수 있도록 무상으로 보급하고 있어 센터 홈페이지(http://srcdsc.snu.ac.kr/srcstat/)에서 다운로드할 수 있다.
현재 서울대 통계학과는 물론 서울대 의과대학 및 의료정보센터에서 시범적으로 활용하고 있고 전남대학교·부경대학교·대구한의대학교 등에서 통계학 교과과정에 활용하고 있다.
최근 글로벌 IT기업인 IBM이 대형 통계소프트웨어사 SPSS를 인수하는 등 세계적으로 빅데이터 분석용 통계 소프트웨어 개발·활용에 대한 관심이 높아지고 있으나 국내 대학, 연구소, 기업 등에서 주로 사용하는 통계 프로그램은 대부분 외국제품으로 저작권료를 지불해야 해 국산 프로그램 개발에 대한 요구가 많았다.
이번에 개발된 통계패키지는 평균, 분산 등 기초통계부터 의학분야에서 사용되는 생존자료, 사회과학 분야에서 활용되는 다변량 자료 및 다수준 모형뿐 아니라 금융분야에서 활용되는 시계열자료 등 다양한 자료를 분석할 수 있는 범용 프로그램이다.
센터는 패키지를 활용해 서울의대 핵의학과와 공동으로 대용량 고차원 뇌영상 기술을 개발하고 신경과와 함께 급성허혈증 뇌졸중 응급환자 20만건의 혈압 데이터 분석에 적용해 뇌졸중 내원 후 증상이 악화되는 경우를 예측하는데 활용하기도 했다.
센터는 보유한 다양한 다단계일반화모형 등에 기반한 독창적인 통계기법과 계산 알고리즘을 구현하고 데이터 분석결과에서 직관적으로 데이터의 의미를 알 수 있도록 시각화하는 등 기존 기술과 차별화했다.
센터의 국산 통계패키지 개발은 외국산 기존 통계 프로그램들에 대한 도전의 시작으로 빅데이터 시대 핵심인 국내 소프트웨어 산업의 촉매제 역할을 할 것으로 기대된다.
센터는 앞으로도 다양한 분야에서 활용할 수 있도록 지속적으로 통계패키지의 기능을 개선해 나갈 예정이다.
이 센터장은 “빅데이터 가운데 의미 있는 지식을 발견할 수 있는 분석도구인 통계 소프트웨어가 없다면 지식가뭄 현상을 마주할 것”이라며 “SRC-STAT으로 빅데이터 분석이 가능해 이번 성과는 국내 통계SW 산업 발전의 계기가 될 것”이라고 밝혔다.