바로가기 메뉴
본문 바로가기
주요메뉴 바로가기
ETRI소식 상상을 현실로, 진화하는 ICT세상, 고객과 함께 ICT미래를 열어가겠습니다.

연구개발보도자료

ETRI, 표준형 한국어 공통음성 DB 기술이전 실시

- 음성정보처리 분야에서 크게 활용 기대 -
-오는 11월 6일(목) 서울 정보통시연구진흥원에서 기술이전설명회 개최-

한국전자통신연구원(ETRI, http://www.etri.re.kr) 음성/언어정보연구센터(센터장 이영직)는 정보통신부가 출연한 ‘언어정보처리기반기술개발’과제의 일환으로 PDA, 텔레뱅킹, 인터넷뱅킹 등의 음성정보기술 개발에 활용될 “표준형 한국어 공통음성 DB”를 구축하여 관련 산업체 및 학계에 기술이전 한다고 밝혔다.

이번에 구축된 표준형 한국어 공통음성 DB는 유․무선 전화망, PC 마이크․헤드셋, VoIP, PDA 등의 다양한 통신망 환경에서 1,000명의 화자가 발성한 단어, 숫자, 문장 DB와 남녀 성우가 발성한 낭독체․대화체 합성용 문장 DB, 언어모델링용 텍스트 DB 등 총 23종의 음성 및 텍스트 DB로 구성되어 있다. 특히 숫자음 음성의 경우, 철자전사 외에 소리나는대로 적는 발음전사 정보를 포함하였기 때문에 정밀한 숫자음 음향모델링이 가능하게 되었다.

본 음성 DB는 음성정보 관련업체에서 음성인식, 음성합성, 화자인식 기술 개발에 직접적으로 활용될 수 있다. 음성인식의 활용분야로는 음성으로 전화를 걸어주는 서비스, 대화형 음성 인터페이스를 통한 증권정보조회 및 쇼핑몰 서비스, 음성을 이용한 홈 오토메이션 등의 기술이 있다. 또한 음성합성분야는 주식정보, 일기예보, 교통정보 등을 음성으로 들려주는 음성정보시스템 및 장애인용 정보시스템 등에 활용된다.

음성정보기술은 21세기를 선도하는 유망 신기술로서, 선진 각국들은 관련 기술개발에 대규모 투자를 하고 있으며, 국내에서도 보이스웨어, SL2 등 100여개 음성정보기술 관련 산업체가 활발히 사업을 추진하고 있다. 그러나 음성정보처리기술 개발을 위한 필수요소인 음성 DB 구축은 대규모 인원의 화자 녹음, 수집시스템 구축, DB 검증 등에 막대한 시간과 비용이 소요되고 초기 투자 비용면에서 많은 위험을 안고 있어 영세한 국내업체에게는 매우 어려운 실정이었다.

ETRI 이영직 센터장은 “이번 DB 배포를 통해 국내 산업체간 음성/텍스트 DB 구축의 중복 투자를 제거하여 국가적으로 효율적인 자원 활용을 유도하는” 것이라며 “침체되어 있는 국내 음성분야 산업을 활성화 할 수 있는 계기가 될 것”으로 전망했다.

한편, ETRI의 한국어 공통음성 DB는 2003년 11월부터 기술이전 신청을 받을 예정이다. 이와 관련 http://voice.etri.re.kr에서 DB 상세규격, 배포조건, 기술이전절차 등 상세한 내용을 검색할 수 있다. 오는 11월 6일(목) 오후 2시, 서울 강남에 소재한 정보통신연구진흥원 교육장에서 동 기술에 대한 기술이전설명회가 있을 예정이다.

TOP