Skip navigation

vol.06 2013.12.10
  • ETRI홈페이지
  • 구독신청
  • 독자의견
스페셜
영어ㆍ중국어ㆍ일본어 넘어 이제 스페인어도 자동번역 가능
이제는 사람들이 음성으로 텍스트를 작성하고, 웹 검색을 한다. 네비게이션은 목적지를 손으로 입력하지 않고 말로 입력할 수 있다.

이처럼 음성인식 기술의 활용이 다양해지고 일반화 되고 있는 가운데 외국인과 자유로운 대화가 가능한 자동통역서비스의 진화도 거듭되고 있다. 즉 더 많은 언어에 대한 통역서비스를 추가하며 기능과 활용범위를 확장해가고 있는 것이다. 이러한 가운데 외국어 음성 DB에 대한 중요성 또한 강조되고 있다.


스마트 모바일 언어음성 번역기술

요즘 국내 업체는 물론, 애플, 구글 등 세계적인 글로벌 기업들 간에 스마트폰을 이용한 언어음성 번역기술 경쟁이 치열하게 전개되고 있다.

국내 스마트폰의 번역기는 한국어, 중국어, 프랑스어, 독일어, 이탈리아어, 일본어, 포르투갈어, 스페인어를 번역해주는 기능을 갖추고 있다. 번역기는 국내 기술로 자체개발한 DB를 이용하기도 하지만 국내에 DB가 없을 때는 외국에서 개발한 음성인식 및 번역엔진을 도입, 탑재하고 있는 상황이다.

또한 언어음성 DB 구축에는 철저한 품질 관리가 따르기 때문에 가격도 비싸다. 유럽 ELRA(European Language Resources Association) 등 해외로부터 일부 외국어 DB를 구입하기 위해서는 3백~5백 명이 발화한 음성 DB의 경우 1~2억 원 정도의 비용이 소요된다. 따라서 기술 자립을 위해서는 다국어 언어음성 DB 구축이 시급한 상황이다.

ETRI는 이러한 산업계의 요구에 부응, 지난 2007년부터 한·영·일·중 등 다국어 언어음성 DB를 구축·배포해 왔으며, 지난해에는 스페인어 대화체 언어음성 DB를 구축 올해부터 본격 배포할 예정이어서 관심을 모으고 있다.

스마트 모바일 인터페이스 시장의 경쟁이 심화되고 있는 상황에서 정부출연연구기관인 ETRI가 직접 나서서 언어음성 DB 보급에 나섬으로써 향후 스마트 인터페이스 분야에서 외국산 제품의 시장점유를 줄이는 데 큰 역할을 할 것으로 기대되고 있다.
스페인어 DB 20만 문장 배포

ETRI는 미래창조과학부와 한국정보화진흥원의 국가DB사업 지원을 통해 지난 2011년부터 구축해온 ‘스마트 모바일용 다국어 언어음성 DB’ 중 스페인어 DB 20만 문장을 일반인에게 유료로 배포할 예정이다. 이번에 배포되는 DB는 ▲스페인어 대화체 음성 DB ▲한국어-스페인어 대화체 대역문장 DB 등의 언어음성DB이다.

자동통역의 정확성을 높이기 위해서는 구어체 DB가 반드시 필요하다. 이번에 배포되는 DB는 우리가 일상생활에서 말하는 구어체 문장으로 이루어져 있으며, 700명분에 달하는 음성DB가 동원된 대규모 언어음성 DB이다. 특히 국가DB사업에서 요구하는 99.9%의 품질 수준에 합격한 언어음성DB를 통해 언어음성기술의 완성도를 한층 더 높였다. 이를 바탕으로 다국어 음성인식 및 자동번역 기술, 영어교육 개발 등에 널리 활용될 전망이며, 신규시장 창출 및 국가경쟁력 강화에도 큰 기여를 할 것으로 기대된다.

한편 스페인어 DB를 배포하면서 기존의 ‘중국어 대화체 음성DB’ 4백명분과, ‘일본어 대화체 음성DB’ 3백명분을 업데이트해 추가 보강했다.
360억 원 절감의 효과

그동안 ETRI가 언어음성 DB를 배포한 업체들은 삼성전자, LG전자, KT, NHN, 다음, 보이스웨어, 쓰리소프트, 트란소노, 인피니티텔레콤, 디오텍, 시리우스소프트, CSLI, 솔트룩스 등이 있다.

현재 ETRI는 2014년 2월, 국내 54개 기관에 208개 DB를 배포하여 총 360억 원에 해당하는 비용 절감 성과를 얻었다. 이번에 배포하는 총 4종의 DB를 국내 10개 기관에 배포할 경우 최소 60억 원의 수입대체효과가 발생할 것으로 전망하고 있다.

향후 ETRI는 국가DB사업을 통해 2014년 안에 프랑스어를 추가 구축할 예정이며 오는 2017년까지 독일어, 러시아어, 동남아 국가들의 언어로까지 확장해 DB를 보급할 계획이다.

스마트 모바일 인터페이스 분야의 글로벌 경쟁 심화 속에 다국어 음성 DB 구축은 간과할 수 없는 과제이다. ETRI의 다국어 언어음성 DB 구축 및 보급을 통해 경제적인 효과는 물론, 언어 장벽으로 인한 소통의 한계를 점차 허물어나가기를 기대해 본다.   
top