VOL. 184 October 2021
지난 2020년 등장한 인공지능, ‘GPT-3(Generative Pre-Training)’는 대화의 문맥을 이해하고
창의적인 답변을 내놓으며,
사람이 쓴 것과 구별하기 어려운 글을 작성하는 등 세간의 이목을 집중시켰다.
인공지능이 우리 삶 속에 점점 더 가까이 다가오는 지금, 사람처럼 글을 이해하고 필요한 정보를 찾아주는
인공지능을 연구하는 언어지능연구실 임준호 책임연구원을 만나 이야기를 들어봤다.
안녕하세요, 저는 언어지능연구실에서 근무하고 있는 임준호입니다. 저는 현재 엑소브레인이라는 국가 과제 책임을 맡고 있습니다. 언어지능연구실은 사람이 사용하는 언어, 특히 한국어를 중점적으로 컴퓨터가 이를 잘 이해하고 처리할 수 있도록 하는 연구를 진행하고 있습니다.
보통 언어를 인간이 다른 종들과 다른 특징으로 꼽습니다. 사람이 생각하는 수단이자, 감정과 생각을 전달하고 다른 사람을 설득하는 수단이 바로 언어인데요. 컴퓨터가 이런 인간의 언어를 잘 처리하게 하려면 어떻게 해야할까 하는 점에 매력을 느껴 이런 연구를 시작하게 됐습니다.
현재 전 세계적으로 인공지능이 크게 관심을 받으면서 많은 기업이나 대학, 연구단체에서 인공지능을 연구하기 시작했습니다. 최근에는 샌프란시스코의 인공지능 연구기관 ‘오픈AI’가 구축한 GPT-3가 큰 관심을 받았어요. 2020년 출시 당시 GPT-3가 쓴 글은 인간이 쓴 글과 구분이 가지 않을 정도로 훌룡했죠.
이후 국내 여러 대기업에서 대규모 R&D 투자 계획을 밝히고 경쟁적으로 새로운 서비스와 기술을 개발하기 시작하면서 시장 자체는 커졌습니다. 하지만 아직까지 해외에 비해서 연구의 다양성 측면에서는 아쉬운 점이 있습니다. 예를 들어 상식에 대한 추론, 딥러닝의 약점을 보완하는 연구 등은 아직 많이 부족한 상황입니다.
한국어와 영어의 차이점을 생각해보면, 영어는 굴절어라고 해서 단어의 끝에 어미가 변화하고 명사나 동사, 전치사와 조사가 각각 띄어쓰기로 구분됩니다. 그런데 한국어는 교착어라고 해서 명사나 동사, 조사 등이 하나의 어절로 결합합니다. 그래서 영어를 처리하는 것처럼 띄어쓰기를 기준으로 처리하면 안 되고 한국어의 최소 의미 단위인 형태소를 기준으로 처리해야 합니다. 즉 영어를 처리할 수 있는 기술을 그대로 적용하면 안 되고, 한국어에 맞게 개선하고 적용하는 작업이 필요한 거죠.
이렇게 각 언어의 특성이 다르지만 구글이나 페이스북 같은 글로벌 기업은 전 세계 언어를 처리할 수 있는 통합 모델을 만들고 싶어 합니다. 그런데 전 세계의 언어를 모두 처리할 수 있는 모델은 각각의 언어에 대해 최고 성능이 나오기는 어렵습니다. 최고 성능을 내려면 각각의 언어마다 모델을 개발하는 것이 좋아요.
먼저 질의응답 기술은 사용자가 모르는 내용을 물었을 때 문서 안에서 사용자가 원하는 부분을 사용자에게 제시해주는 기술입니다. 이 기술과 비교되는 것이 구글이나 네이버에서 검색어를 입력해서 검색 결과를 확인하는 정보검색 기술인데요, 질의응답 기술은 사용자가 문서를 클릭해서 원하는 내용을 찾는 과정까지도 컴퓨터가 대신해준다는 장점이 있습니다.
기존의 질의응답 기술은 위키백과, 뉴스 등 정형화된 텍스트에서만 활용할 수 있고, 우리가 일반적으로 사용하는 한글, Word, PDF 등의 오피스 문서에는 활용할 수 없었습니다. 이런 오피스 문서와 같은 경우에는 정부 기관에서 밝히는 고시, 통신사나 금융 상품에 가입할 때의 약정, 자동차 메뉴얼 등의 전문적인 내용을 담고 있어 정보의 복잡성과 다양성이 크기 때문이죠.
하지만 저희가 개발한 기술은 질문에 대한 답을 인공지능이 명확하게 판단하고 근거까지 제시할 수 있습니다. 단어가 정확하게 일치하지 않아도 활용할 수 있죠.
다음으로 패러프레이즈 인식 기술은 두 개의 문장이 주어졌을 때 같은 문장인지, 다른 문장인지 구분하는 기술입니다. 예를 들어 ‘철수가 빨간 자전거를 샀다’, ‘철수가 산 자전거는 빨간색이다’와 같은 기술들은 기존의 딥러닝 기술로도 잘 구분할 수 있었지만, ‘철수가 자전거를 샀다’와 ‘철수가 자전거를 안 샀다’라는 두 문장은 구분하지 못했거든요. 사람이 봤을 때는 ‘안’ 한 글자 차이로 명확하게 다른 문장이지만 인공지능은 이 차이를 잘 구별하지 못했습니다. 저희는 이와 같은 견고성의 한계를 개선한 API를 공개한 것이죠.
기존의 언어를 사용하는 인공지능, 대표적인 예로 AI 스피커가 있죠. 이런 기술은 노래를 틀어주거나, 날씨를 알려주거나, 알람을 설정해서 일정 관리를 하는 등 생활의 편리성을 중심으로 개발됐습니다. 그런데 오피스 문서에는 좀 더 전문적인 지식들이 담겨있어요. 이번 기술을 활용해서 사용자가 질문하는 내용에 대한 답을 제시함으로써 편리성뿐 아니라 사용자의 학습과 똑똑한 의사결정에 도움을 줄 수 있을 것입니다.
더불어 저희 기술은 모든 정부기관 홈페이지나 기업의 그룹웨어 등 정보검색이 들어가는 모든 곳에 들어갈 수 있는 기술입니다. 구글이나 정부부처 홈페이지 등에서 사용자가 궁금한 내용과 관련된 답과 근거를 찾고 제시하는 기술로 활용될 수 있습니다.
현재 저희가 공개한 기술은 한컴오피스에서만 사용할 수 있는데, 실제 개발한 기술 자체는 Word나 PDF 같은 파일에서도 다 동작이 가능합니다. 이렇게 활용 가능한 범위를 넓히는 부분이 가장 먼저 해결할 과제라고 볼 수 있겠습니다.
현재 저희가 개발한 기술은 사용자의 질문에 대해 문서의 한 단락 안에 답과 근거가 있어야만 처리할 수 있습니다. 저희는 만약 질문에 대한 답이 복잡해서 두세 문단에 걸쳐 기술되어 있더라도 해결할 수 있는 기술을 개발하고 있습니다.
최종적인 목표를 묻는 질문에 임준호 연구원은 “인공지능 기술이 점차 발전하면서 사람들이 더 똑똑하게 판단하고 의사결정을 할 수 있도록 돕는 기술을 개발하고자 합니다. 이 기술을 통해 상황에 맞는 정보를 사용자에게 정확하게 제시하고 더 현명한 의사결정을 도와줄 수 있다고 생각합니다.”라고 답했다. AI로 더 풍요로운 삶을 꿈꾸는 그의 모습은 아름다운 열정으로 빛났다.