언어의 장벽을 뛰어넘는
ICT 대표 기술 ‘지니톡’
휴대형 한·영 자동통역시범서비스 실시
ETRI는 2012년부터 ‘자동통역기술’을 이용한 모바일 단말용 자동통역 앱 ‘지니톡(GenieTalk)’의 시범서비스를 시작했다. 2012년에는 지니톡 첫 번째 버전(한·영 통역)을 제주도(1월), 여수세계박람회(5~8월)에서 시범서비스하고, 10월에는 범위를 넓혀 전 국민과 한국을 방문 중인 외국인 전체를 대상으로 서비스했다. 당시 지니톡의 자동통역률은 80% 이상으로, 세계 최고로 인정받던 구글의 한·영 자동통역 기술 대비 15% 이상의 경쟁우위를 보였다. 지니톡은 문화체육관광부 주최 ‘2012 스마트콘텐츠 어워드 & 콘퍼런스’에서 대상을 차지하기도 했다.
01
똑똑한 자동통역 앱
지니톡
해외여행을 할 때, 국내에 있지만 외국인이 길을 물어올 때 등 원치 않아도 외국인과 의사소통해야 하는 경우가 종종 발생한다. 외국어에 자신 있는 여행객이면 문제가 없겠지만, 그렇지 못한 경우라면 외국어로 의사소통하는 자체가 큰 고민이 아닐 수 없다.
이런 문제를 말끔히 해결해 줄 구원투수가 나타났다. 바로 ETRI에서 국민을 대상으로 서비스를 실시하고 있는 스마트폰용 어플리케이션 지니톡(Genie Talk)이 그 주인공이다.
지니톡은 소프트웨어 산업원천 기술개발사업의 일환으로 ETRI가 순수 국산기술로 개발한 자동통역기술을 기반으로 만들어졌다. 현존하는 최강 통역기라 불리는 구글보다 결과물도 우수하고 편리한 사용자 인터페이스를 제공한다. 출시 100일 만에 다운로드 수가 120만 건을 돌파하는 인기 앱으로 자리매김한 지니톡. ETRI가 만들어 세계인이 함께 쓰는 지니톡의 놀라운 성능과 활용법을 면밀히 알아보자.
02
소프트웨어의 꽃
자동통역기술
자동통역기술이란 각자 모국어를 사용하여 외국인과도 자유롭게 대화할 수 있도록 하는 기술을 말한다. 소프트웨어의 꽃이라고 불릴 만큼 구현하는 데에 상당한 시간과 비용, 기술력이 소요되며 파급효과 또한 큰 기술이다. 지구촌의 가장 큰 문제 중 하나인 언어의 장벽을 해소하기 위한 최적의 솔루션으로 자동통역 기술이 각광받고 있다. 글로벌 기업 및 연구기관들이 자동통역기술을 국가 및 기업 경쟁력 제고에 있어 중요한 요소로 인식하면서 기술개발 및 상용화에 박차를 가하고 있다.
자동통역기술은 크게 음성인식, 자동번역, 음성합성, 이렇게 세 가지 요소로 구성되어 있다. 자동통역의 첫 단계인 음성인식에서는 음성이 통역기에 들어오면 문자로 바꾸는 일이 이루어진다. 음성인식기는 단어별로 발음이 표시되어 있는 발음 사전을 참고해 단어를 탐색해 최적의 단어열을 얻는 방식으로 작동된다. 이렇게 골라진 단어열을 언어 모델에 적용하여 최종적인 문장 형태로 출력 결과를 뽑게 된다.
음성인식 다음 단계는 원문 텍스트를 다른 언어로 바꾸는 자동번역 과정이다. 보통 자동번역 과정에서 사용되는 텍스트 문장에는 번역 과정에서 염두에 두어야 할 정도의 오류는 없다고 할 수 있다. 입력문장을 그대로 번역 과정에 사용할 수 있는 것이다. 이는 곧 자동통역 과정에서의 대부분의 오류는 음성인식 단계에서 발생한다는 이야기다. 통역이 잘 되는지의 여부는 음성인식기술이 얼마나 고도화되어 있는지에 달려있다.
자동통역의 마지막 단계인 음성합성은 목적 언어로 번역된 내용을 사람들이 들을 수 있는 말의 형태로 제공하는 과정이다. 자동통역을 위해서는 음성인식과 동일하게 대화체 음성합성기술이 요구된다.
03
순수 우리 기술로 만든
자동통역 앱 지니톡
지니톡은 관광, 일상용어 중심의 한국어 27만 개 단어와 영어 6만 5천개 단어를 인식, 기본적인 의사소통에 큰 무리가 없을 정도의 높은 완성도를 확보했다. 제주지역 시범서비스를 성공적으로 마치고, 2012 여수세계박람회에도 활용되어 획기적이라는 평가를 받았다.
또한, 2014년 인천아시안게임에서도 중요한 역할을 했다. 지니톡을 기반으로 제작된 인천아시안게임용 자동통역 앱인 ‘인천광역시 통역비서’를 다운로드 받은 사람은 8월 말부터 10월 말까지 두 달간 총 14,400여 명에 달했다.
2016년 5개 국가 언어(영어·일어·중국어·스페인어·불어)에 대한 자동통역이 가능해진 지니톡은 한컴인터프리를 통해 ‘한컴 말랑말랑 지니톡’이라는 이름으로 본격 서비스를 시작했다. 오는 2018년에 열릴 평창동계올림픽에서도 전 세계에서 온 선수와 임원에게 자동통역서비스를 제공할 계획이다.
자동통역서비스를 비롯해 음성인식 분야와 언어번역 분야 SW를 개발하기 위해서는 필수적으로 다국어 언어음성DB가 필요하다. ETRI는 한국어, 영어, 일어, 중국어는 물론 2014년 프랑스어, 2016년에는 독일어, 러시아어, 아랍어, 베트남어 대화체(구어체)에 대한 언어음성DB를 지속적으로 구축·배포했다. 이 DB들은 유럽언어자원협회(ELRA) 등 해외 기관보다 90% 이상 저렴하게 국내 중소기업에 제공되고 있으며, 2016년 4월 기준 국내 57개 기관에 247개 배포돼 총 430억 원에 해당하는 비용절감 효과를 냈다.