컴퓨터가 사람처럼 글의 맥락까지 파악하는 ‘생각하는 컴퓨터’ 시대가 앞당겨질 것으로 기대되고 있다.
울산대학교 컴퓨터정보통신공학부 한국어처리연구실 옥철영 교수팀은 ‘동형이의어 분별 시스템’을 바탕으로 ‘세종말뭉치 검증 및 원시말뭉치 품사·동형이의어 태깅 시스템’을 개발해 최근 개최된 2009년 국어정보처리시스템 경진대회에서 금상을 수상했다.
이 시스템은 국립국어원이 우리말의 정보화·세계화·표준화를 위해 만든 세종형태 의미 말뭉치(corpus)를 검증하고, 단어 형태가 같아도 뜻이 다른 동형이의어(同形異義語)의 의미를 분별해 사전상 어깨번호(태그, tag)를 닮으로써 기계적으로 의미 구분이 가능하게 한 프로그램이다.
‘억새’ ‘날짐승’ ‘사이’ 등을 나타내는 명사와 ‘피륙의 날을 세는 단위’인 의존명사, ‘새로움’을 뜻하는 관형사 등으로 쓰이는 ‘새’라는 단어도 기계적으로 의미 구분이 가능해졌다. 국립국어원이 ‘21세기 세종계획’에 따라 지난 1998년부터 시작해 2007년까지 10년 동안 구축한 세종말뭉치의 활용도를 높여 국어청보처리 분야의 발전에 기여했다는 평가를 받았다.
한편 이번 대회는 국립국어원과 한국정보과학회 언어공학연구회가 말뭉치를 분석하고 활용하는 국어정보처리시스템의 개발 및 보급을 통한 국어 정보화의 활성화를 위해 마련됐으며, 모두 22팀이 응모했다.
아주경제= 김선환 기자 shkim@ajnews.co.kr
(아주경제=ajnews.co.kr) 무단전재 배포금지