sub contents

Focus

Vol.225

ETRI,
엑소브레인 연구로
한국어 AI 정착 앞당기다

ETRI가 2013년부터 10년간 총괄한 『엑소브레인』 사업이 마무리되었다.
엑소브레인은 ‘내 몸 바깥에 있는 인공두뇌’라는 뜻으로,
해당 사업은 인간의 지적 노동을 보조하는 국산 한국어 인공지능(AI) 개발을 목표로 진행되었다.

함께 일할 수 있는 인공지능을 개발하다

엑소브레인 사업의 세부 목표는 ▲언어 문법 분석을 넘어선 의미 추론 기술 개발 ▲사건의 원인, 절차, 상관관계 등 고차원 지식 학습 및 축적기 기술 개발 ▲전문 분야를 대상으로 인간과 기계의 연속 문답을 통해 심층 질의응답 기술 개발 및 국내외 표준화였다.

해당 사업은 지난 2013년 5월부터 2023년 2월까지 총 3단계로 진행되었다. ▲총괄 및 1세부 과제는 ETRI ▲2세부는 솔트룩스 ▲3세부는 한국과학기술원(KAIST)이 주관했다. 연구진은 금융, 법률, 특허 등에 조사하는 전문가들의 조사·분석 업무를 보조할 수 있도록 기술을 개발했다. 특히 자연어 질문에 대해 문서에서 ▲정답을 찾아주는 심층 질의응답 기술 ▲한국어 언어분석 기술 ▲딥러닝 언어모델 기반 응용 기술 ▲지식베이스 기반 추론 기술 등 세계 최고 수준의 한국어 인공지능 기술을 개발했다.

성공적으로 마무리된 엑소브레인

ETRI의 ‘엑소브레인’이 장학퀴즈에 출연해 우승하는 모습

ETRI연구진이 언어지능 기술 및 기계학습 데이터를 공유하는 오픈 API·데이터 서비스 포털

연구진은 그동안 다양한 성과를 창출했다. 2016년 11월에는 인간 퀴즈왕들과의 장학 퀴즈 <대결! 엑소브레인> 대결에서 우승함으로써 국산 AI의 자주권 확보 가능성을 입증했다. ETRI는 2017년부터 해당 사업을 통해 개발된 언어지능 기술과 기계학습 데이터를 오픈 API·데이터 서비스 포털(http://aiopen.etri.re.kr)을 통해 보급했다. 이를 통해 18여 종의 언어처리 기술, 14종의 학습데이터, 2종의 언어모델이 공개되었다. 공개된 데이터는 2022년 말 기준, 2,349개 기관에서 6천 1백만 건 이상 사용되었다. 2019년에는 구글이 개발한 언어모델 버트(BERT) 대비 성능이 4.5 % 뛰어난 한국어 언어모델 코버트를 개발해 국내 최초로 공개했다.

이외에도, 엑소브레인 연구진은 10년간 193건의 기술이전을 통해 기술료 85.3억 원과 상용화 133억 원을 달성했다. 구글·IBM 등과 같은 외산 AI 솔루션의 국내시장 잠식을 막는 데에도 크게 기여했다. 이외에도 언어지능 데이터 및 기술과 관련된 표준화와 다수의 특허, 논문 제출 등을 통해 원천기술 확보하는 데에 이바지했다. 이러한 성과를 창출하는 과정에서, 2세부 주관기관인 솔트룩스는 2020년 7월, 1세부 공동기관인 마인즈랩은 2021년 11월, 각각 코스닥에 상장하기도 했다.

끝이 아닌 새로운 시작

이러한 엑소브레인 연구개발사업이 우리나라 AI 생태계를 활성화하고 한국어 AI 정착을 크게 앞당겼다는 평가가 이어지고 있다. 이로써 대한민국은 세계적인 인공지능 선도국으로 거듭나고 있다.

엑소브레인 사업은 여기서 마무리되었지만, ETRI 연구진의 도전은 여기서 그치지 않는다. 연구진은 지난해 4월부터 엑소브레인 사업 후속 과제로 자연어처리 기술에 설명성을 확장해 다양한 분야 전문가의 의사결정을 지원할 수 있는 인공지능 SW 개발 연구를 진행 중이다. 일반인의 사용이 용이하고 범용성이 좋은 ChatGPT와는 다르게, 법률, 금융과 같이 특정한 도메인에 특화된 자연어 기반 설명(정답)과 그 설명의 신뢰성 있는 근거를 같이 제시함으로써 차별화된 결과를 보여줄 수 있을 것으로 기대한다.

엑소브레인 프로젝트 총괄 책임을 맡고 있는 ETRI 배경만 박사는 “10년간 축적된 엑소브레인 과제의 성과가 사장되지 않고 지속적으로 활용될 수 있게 노력하고, 과제원들과 후속 과제를 통해 엑소브레인 기술에서 한 단계 발전된 기술 개발을 위해 열심히 노력하겠다.”라고 말했다.