바로가기 메뉴
본문 바로가기
주요메뉴 바로가기
ETRI소식 상상을 현실로, 진화하는 ICT세상, 고객과 함께 ICT미래를 열어가겠습니다.

연구개발보도자료

ETRI, 다국어 언어/음성 지식DB 국내 배포

ETRI, 다국어 언어/음성 지식DB 국내 배포

- IT839 신성장동력사업 응용분야 핵심 요소 기술
- 언어/음성 분야 산업발전 및 관련연구 저변 확대 기대



      다국어 언어/음성 지식 데이터베이스(DB)가 국내 연구진에 의해 구축되어, 국내 산/학/연에 배포 및 공동 활용으로 관련 산업이 활성화될 전망이다.

      ETRI(한국전자통신연구원, 원장 최문기)는 6일, 2006년부터 2년여에 걸쳐 구축한 “다국어(영어, 중국어, 일본어) 언어/음성 지식 데이터베이스(DB)”를 국내 산업체, 대학 및 연구기관을 대상으로 배포한다고 밝혔다.

      언어/음성처리 기술은 정부의 신성장동력산업 응용분야의 사용자 인터페이스를 위한 공통 핵심기술로서 부각되어 왔으며, 언어/음성처리 기술개발을 위해서는 관련 언어/음성 데이터베이스(DB)가 필수적인 요소이다.

      그 동안 국내 언어/음성처리 기술개발 업체에서는 음성/언어 자원 DB 구축에 많은 시간과 비용을 투여해 왔다.

      특히, 국내업체간 중복 구축으로 인한 고비용 저효율의 문제와 다국어 음성/언어DB의 부재는 외국 경쟁업체에 비해 국내 업체들의 경쟁력을 약화시키는 주요 원인으로 지적되어 왔다.

      이번에 구축된 다국어 언어/음성 지식 데이터베이스(DB)는 음성/언어기술 이용 상황에 따른 발음패턴, 어휘, 문장 구조 등의 변화와 주변 환경 및 관련 기기의 다양한 특성을 고려하여 총 40여종을 외국 현지에서 수집하여 구축한 것이 특징이다.

      다국어 언어/음성 DB 구축 결과는 지능형 로봇, 차세대PC, 텔레매틱스, 디지털홈, 디지털콘텐츠, 이동통신 등 IT839 신성장동력산업용 차세대 음성 인터페이스의 핵심 요소기술 개발에 활용될 예정이다.

      이외에도 ETRI 주관 하에 2004년부터 2005년까지 이미 구축하여 배포 중인 “표준형 한국어 언어/음성 지식 DB” 는 『음성인식/음성합성용 음성DB』, 『자동번역용 한/영 연결어 대역패턴』, 『정보검색용 개체명 사전』등 총 70여종에 이른다.

      특히, ETRI는 본 DB를 활용하여 2005년부터 『한/영 특허문서 자동번역 시스템』및 『기술논문 자동번역 시스템』 등을 개발하여 산업체에 기술 이전하여 일반인을 대상으로 특허 문서 자동번역 서비스를 시행 중에 있다.

      또한, 이전된 특허번역 기술은 현재 특허청에서 실시하고 있는 특허문서 자동번역 서비스에 적용되어, 연간 700억원 이상의 비용절감 효과가 있는 것으로 추정된다.

      ETRI 박상규 음성/언어정보연구센터장은 “다국어 언어/음성 DB 구축으로 동 분야의 연구개발 진입장벽을 해소함으로써 학계, 산업계 등이 기술집약적인 언어/음성 처리 알고리즘 및 응용서비스 개발에 집중하게 하여 언어/음성 분야 산업 발전에 기여하고, 관련 연구의 저변을 확대할 수 있을 것”이라고 말했다.

      본 사업을 주관한 ETRI는 현재 DB 신청을 접수 중에 있으며, 소정의 이용수수료는 DB 유지보수 및 관리에 소요되는 비용으로 활용할 계획이다. (참조: http://slrdb.etri.re.kr)

      한편, 이 사업은 정보통신부의 지식정보자원관리사업 중 ‘다국어 언어/음성 데이터베이스 구축’ 과제의 일환으로 추진되었다.



[배포번호 : 2007 - 113]



TOP