정보보호 R&D 데이터셋은 정보보호 기술 개발 및 검증을 위한 필수요소로 악성코드(PC 악성코드, 모바일 악성코드), 네트워크 트래픽 등 정보보호 R&D 기술개발과 검증 등에 필요한 데이터 집합체를 말한다.
‘데이터셋’은 학습 데이터가 기술품질을 좌우하는 지능정보시대에 그 중요성이 점차 커지고 있다. 미국과 일본 등 선진국은 이미 사이버보안연구에 활용되었던 악성코드, 해킹·이상 행위 정보, 공격트래픽 등의 데이터셋을 연구기관, 학교, 기업, 비영리기관과 공유하고 있다.
KISA는 올해 우선 KISA・세인트시큐리티와 고려대학교의 사이버보안 R&D 연구에 활용했던 PC악성코드 분석결과, 자바 스크립트 등 스크립트 난독화 도구, 모바일 정상․악성앱, 자동차 해킹 데이터 등을 공유하기로 했다. 정보보호 전문 연구소 및 기업, 학교 등의 협조를 얻어 공유 데이터 목록을 확대해 나가겠다는 계획이다.
공유된 데이터셋을 활용하고자 하는 국내 기업 또는 연구자는 정보보호산업진흥포털 내 ‘R&D데이터셋’ 페이지에서 데이터 목록, 활용사례, 샘플데이터 정보를 확인 후 필요 데이터를 신청할 수 있다.
신대규 KISA 신대규 정보보호산업본부장은 “정보보호 R&D 데이터셋 공유를 통해 R&D연구에 필요한 데이터 확보 시간을 단축할 수 있을 것”이라며 “국내 기업의 다양한 우수 정보보호 기술 연구 개발을 지원하기 위해 사이버보안 연구 분야 데이터셋 공유를 확대해 나가겠다”고 말했다.