지난 4월 22일 과학기술정보통신부는 과학·정보통신의 날을 맞아 기념식을 개최했다. 이날 행사장에는 800여 명의 과학기술자가 자리를 빛내 주었다. 또한, 과학기술 및 정보통신 진흥 유공자 121명에게 훈·포장, 대통령 표창, 국무총리 표창을 시행했다. 이날 ETRI 지능정보연구본부 민옥기 본부장은 클라우드컴퓨팅, 빅데이터, 인공지능 분야의 공을 인정받아 국무총리 표창의 영예를 안았다. 인터뷰를 통해 그 수상의 주인공을 만나보자
현재 본부에서 진행 중인 주요 세 가지 프로젝트 말씀드리자면, 엑소브레인, 영상지능 딥뷰, 도시교통 시뮬레이션 등이 있습니다. 먼저 엑소브레인은 3년 전 장학퀴즈에 참가해서 우승했던 인공지능 분야 전문 연구개발 프로젝트입니다. 사람을 관찰하면, 인공지능이 나아갈 방향이 나오는 것 같습니다. 그런 측면에서 연구진은 언어 분야를 가장 먼저 공략했습니다. 언어가 사람의 지식을 습득하고, 지능을 발현하는 데 가장 중요한 매개체인 것처럼 인공지능의 가장 중요한 부분도 언어라고 생각했기 때문입니다.
이처럼 엑소브레인은 질의응답 기술입니다. 단답형 해답을 찾는 기술로, 이미 퀴즈 프로그램을 통해 그 우수성을 입증한 바 있습니다. 현재 2단계로 진행 중인 내용은 질문에 대한 답을 문장으로 응답할 수 있도록 하는 것과 특정 지식 분야에 대한 지식을 훈련하는 연구를 진행 중입니다. 지금은 이렇게 분야별로 훈련을 해야 하지만, 사람이 상식을 쌓는 것처럼 인공지능도 향후에는 축적된 지식을 바탕으로 다양한 분야를 대답할 수 있을 것이라 기대하고 있습니다. 현재 엑소브레인은 법률과 특허 부분에 우선 적용해 연구중에 있습니다.
이밖에도 언어지능 측면에서 통·번역과 외국어 학습 등을 연구하고 있습니다. 이를 위해서는 음성을 인식하고, 대화를 이해하고, 다른 언어로의 변환 규칙을 알아야 하는 등 많은 기술적 요소가 필요합니다.
그리고 영상지능 분야의 대표 프로젝트인 딥뷰는 지난 2017년 글로벌 대회인 ‘이미지넷 챌린지 대회’에 출전해 세계 3위를 달성한 바 있습니다. 그 기술을 바탕으로 일차적으로 실 환경에 적용한 곳은 서울 은평구 쓰레기 불법 투기를 찾아내는 시범 서비스였습니다. 그 외에도 현재 대전시, 세종시 등 여러 지방자치단체와 협력해서 적용할 부분을 찾고 있습니다. 또 도시교통 시뮬레이션은 서울시와 협력해 서울시의 효율적인 교통 신호체계를 사전에 검증할 수 있는 방법을 연구 중입니다. 우리 본부에서는 인공지능과 빅데이터 두 개 기술을 연구 중이라고 보시면 됩니다.
우리는 현재의 인공지능을 ‘단일지능’이라고 부릅니다. 단일지능은 언어, 음성, 영상, 센서데이터 등 각 분야에서 지능을 도출해 내는 기술을 말합니다. 이런 단일지능 기술은 국내외를 통틀어 최고의 수준을 보유하고 있다고 자부합니다. 그러나 앞으로는 이렇게 하나씩 개별적으로 보는 지능은 한계가 있다고 생각합니다. 사람이 한가지 감각으로만 상황을 판단하지 않듯이 인공지능도 보고, 듣고, 읽으면서 상황을 판단할 수 있는 종합적 지능이 필요합니다. 우리는 이러한 지능을 ‘복합지능’이라고 부릅니다. 앞으로는 복합지능에 대한 기술이 확보되어야 할 것입니다.
통·번역 분야는 현재 한국어 vs 영어 형태의 1:1 번역이 이루어지고 있어서 중국어, 프랑스어, 독일어 등 주요언어로는 통·번역을 하고 있습니다만, 현재 많이 쓰고 있지 않은 제3국어로의 통·번역은 어렵습니다. 그래서 모든 언어가 가진 의미를 표현할 수 있는 공통된 특징을 찾는 중간 프레임워크를 구축하고 언어 간의 번역을 자유롭게 할 수 있는 만국어 통역 기술을 장기적으로 확보하고자 합니다.
또 언어의 의미를 이해하는 측면에서 현재는 대량의 학습 데이터가 미리 준비되어 있어야 합니다. 따라서 주어진 학습 데이터 안에 있는 범위에서만 응답이 가능하고 공부하지 않아 자료에 없는 데이터로는 응답하기 어려운 상황입니다. 사람은 유추할 수 있는 능력이 있지만, 인공지능은 아직까지 가르쳐주지 않은 것을 유추하기에는 부족합니다. 이를 위해 지속적으로 학습해가면서 새로운 것을 추론할 수 있는 기술도 발전시켜야 합니다.
현재 ETRI는 복합지능을 인공지능의 다음 발전 방향으로 방향성을 잡고, 영상데이터와 언어를 함께 분석할 수 있도록 기반기술을 준비중입니다. 시각 및 언어데이터 등을 동시에 입력받아 동일한 지식 네트워크를 구축하고, 시각과 언어가 주는 정보를 종합하여 상황을 판단하는 기술입니다.
현재 연구원에서 개발하고 있는 복합지능 기술을 증명 차원에서 1차로 적용하고자 하는 분야는 패션코디네이터입니다. 사용자가 좋아하는 색, 취향 등 사용자의 정보를 반영하여 사용자에게 적정한 옷을 추천하고, 적용해보는 응용 분야 입니다. 이렇게 시각과 언어데이터를 접목해 복합지능의 한 예로 접목해 보려 합니다.
현재는 기술력을 높이는 것을 가장 큰 목표로 하고 있습니다. 기술력을 높이는 방향은 세 가지로 볼 수 있습니다. 일단, 무엇보다 여러 개의 지능을 접목한 복합지능 기술력을 확보하는 것이 첫 번째 계획입니다.
두 번째는 딥 러닝이 가지는 한계를 푸는 것입니다. 물론 충분한 데이터가 있어야 하고, 시간도 오래 걸립니다. 또 답을 도출하는 데 한계가 있다 보니, 이를 대체할 수 있는 새로운 원천기술을 찾는 것도 필요합니다. 사람의 생각체계를 닮은 새로운 접근 방법을 찾는 것이라 볼 수 있습니다. 이 목표에 대해서는 몇 년 안에 결과를 내겠다는 장담을 드릴 수 없지만, 연구자로서 원천기술을 확보하는 측면에서 꼭 이런 연구를 해보고 싶습니다.
마지막은 딥 러닝의 경량화입니다. 작은 기계에도 지능을 넣을 수 있는 방향으로 추진하려고 합니다. 딥 러닝은 기본적으로 서버급의 큰 기계에서 이루어지는 것이 일반적입니다. 그러나 다가온 초연결 시대에는 작은 장비들이 더 많이 생겨날 것입니다. 이런 작은 단말에도 지능을 담을 수 있는 방법이 필요한 이유입니다. 스마트폰에 지능을 담는 것은 머지않아 가능하겠지만, 더 나아가서는 센서에 지능을 담는 일도 가능할 것으로 생각됩니다. 어떻게 보면, 인공지능이 발전하는 것은 양방향으로 간다고 보시면 될 것 같습니다. 컴퓨팅 파워가 충분한 대형 서버에서 인공지능의 정확성과 효율성을 높이는 연구 방향과 반대 방향으로 작은 장비에도 지능이 들어갈 수 있도록 연구하는 추진 방향입니다. 이처럼 제시한 목표와 도전의식을 가지고 ETRI의 인공지능 기술력을 발전시켜 나가려고 합니다.
지난 7월 1일 지능정보연구본부에 새로 부임한 민옥기 본부장은 마지막 질문으로 “인공지능이 가장 먼저 적용될 분야는 무엇인가요?”라는 질문에 “다가올 미래에는 지식이 근거가 되는 분야에 인공지능이 가장 먼저 적용될 것으로 보인다.”라고 했다. 이는 사실에 근거한 지식의 결과를 내는 부분에서 시스템이 사람보다 더 뛰어나기 때문이다. 그러나 사람의 일을 인공지능이 완전 대체하는 것은 불가능하다는 것이 그의 지론이다. “기술이 더 발전하더라도 인공지능이 사람을 완벽하게 대체할 수는 없습니다. 인공지능은 사람이 할 수 있는 부분을 1차로 작업할 뿐, 최종 결정과 판단을 내리는 것은 사람이 될 것입니다.”라고 말했다. 그의 말처럼 미래 사회에서는 사람과 인공지능이 함께 협업을 통해 상생해 가지 않을까 생각한다. 가령 인공지능 시스템에 어떤 사전조사를 요청했을 때 “나는 이렇게 생각합니다. 당신은 어떻게 생각해요?”라는 파트너십도 가능해 보인다.