바로가기 메뉴
본문 바로가기
주요메뉴 바로가기
ETRI소식 상상을 현실로, 진화하는 ICT세상, 고객과 함께 ICT미래를 열어가겠습니다.

연구개발보도자료

[2019-06호] ETRI, 5개 국어 음성 및 영어대역문장DB 배포

태국·말레이·인니·베트남·아랍어 언어음성 DB 제공한다

ETRI, 5개 국어 음성 및 영어대역문장DB 배포

- 대화체 200만 발화 음성DB ․ 대역 300만 문장DB 제공

- 13년 간 네이버, 삼성, SKT 등에 367건 배포․550억 절감 효과

- 기술 해외 의존도 낮추고 관련 기술 활용 및 수출 증진 기대ETRI 보도사진

한국전자통신연구원(ETRI)이 국내에서 처음으로 태국어, 말레이어, 인도네시아어의 음성 데이터베이스(DB)와 영어대역문장 DB를 일반에 배포한다. 아랍어 및 베트남어도 함께 배포하는데 기존보다 데이터양을 대폭 늘렸다. 이로써 음성인식 및 번역엔진 해외 의존도를 줄이고 해당 언어를 활용한 다양한 서비스 개발에 큰 도움이 될 것으로 예상된다.

본 음성 DB는 최근 인기 있는 인공지능(AI) 스피커, 내비게이션, 사물인터넷(IoT) 등 음성인식 및 번역 SW개발에 기초가 되는 자료다.

따라서 가능한 품질이 좋고 많은 언어의 DB를 구축하는 것이 서비스 다양화와 고부가가치 서비스기술 창출의 핵심이라 할 수 있다. 

하지만 그동안 DB를 확보하는 과정에 여러 장벽이 있었다. 해외 업체로부터 외국어 음성 DB를 구입할 수 있지만 비용이 많이 든다. 그마저도 관련 자료가 없는 나라의 언어는 자체적으로 수집하는 수밖에 없었다.

이에 ETRI가 ▲태국어 ▲말레이어 ▲인도네시아어 ▲아랍어 ▲베트남어 ‘대화체 음성DB 200만 발화(發話)’와 ▲영어–태국어 ▲영어–말레이어 ▲영어–인도네시아어 ▲영어–아랍어 ▲영어–베트남어‘대화체 대역(對譯)문장DB 300만 문장’을 배포한다. 태국어, 말레이어, 인도네시아어 자료는 국내 최초로 제공되며 아랍어 및 베트남어는 ETRI 기존 자료에 데이터양을 늘려 배포한다.

국내 관련 업체들은 ETRI가 제공하는 자료를 받아 DB구축 비용을 대폭 절감할 수 있다. 해외 업체로부터 DB를 구입하는 경우, 언어 당 1~2억 원 정도의 비용이 소요된다. 하지만 ETRI는 해외 DB 가격 대비 5% 수준에서 제공할 예정이다.

특히 이번 DB는 최대한 많은 사람들의 언어 데이터를 얻기 위해 크라우드 소싱(Crowd sourcing) 기법을 도입했다. 포인트를 제공하여 일반 사용자들의 참여를 유도한 결과, 총 25,000여 명이 발화에 참여했으며 같은 예산으로 기존보다 최대 8배 많은 데이터를 수집할 수 있었다. 

단순히 데이터 양만 늘린 것이 아니라 높은 정확도까지 확보했다. 외부 감리 업체 측정 결과 99% 이상의 높은 품질을 인증 받았다. 기존보다 더욱 많은 양을 축적한 데이터를 토대로 집단 지성에 의한 검증 시스템을 도입했기 때문이다.

ETRI 음성지능연구그룹 윤승 박사는“본 DB를 활용하여 언어음성기술을 개발할 경우, 다양한 외국 신규시장 진출 및 국가 경쟁력 강화에 큰 기여를 할 것으로 예측한다”고 설명했다.

그간 ETRI는 외국 기술 잠식을 차단하고 국내 기업들의 관련 기술 수출 증진을 위해 지능형 언어음성 데이터를 꾸준히 확보해왔다. 2011년부터 한·영·일·중 등 다국어 언어음성DB를, 2014년에는 프랑스어, 2015년에는 독일어, 러시아어, 아랍어, 베트남어를 구축 및 배포한 바 있다. 

현재까지 삼성전자, LG전자, KT, 네이버, 카카오, 엔씨소프트, 보이스웨어, 셀바스AI, 시스트란 인터내셔널, 솔트룩스 등 국내 60개 기관에 367건의 DB를 배포하며 총 550억 원에 해당하는 비용 절감 성과를 얻었다. 이번 DB 역시 국내 10개 기관에 배포할 경우, 최소 150억 원의 수입대체 효과를 얻을 수 있다.

ETRI가 배포 중인 DB목록은 총 45종으로 ETRI 홈페이지(ETRI소식 – 공지사항 검색창에“언어음성”입력)에서 쉽게 찾아볼 수 있다. 이번 추가 공개하는 DB도 ETRI 홈페이지를 통해 확인이 가능하다. 

향후 연구진은 기존 배포 언어들의 정확도 및 데이터 품질 개선에 나서는 한편 영어, 중국어, 일본어 음성 데이터 구축을 위해 노력할 예정이다.

본 연구는 행정안전부가 한국정보화진흥원을 통해 추진한 2018 국가중점데이터 개방 사업의 일환인“다국어 5종의 음성과 영어대역문장 DB 구축 및 개방”사업의 일환으로 진행되었다. <보도자료 본문 끝>  


[배포번호:2019-06호]

TOP