sub contents

음성만으로 치매를 예측하는
인공지능 기술

내년부터 한국은 65세 이상 인구가 전체의 20% 이상이 되는 ‘초고령 사회’로 진입한다.
나이가 들수록 사람들이 걱정하는 것 중 하나가 치매다.
서기 600년경 발간된 책*에 언급돼 있을 정도로 그 역사가 깊은 치매는 퇴행성 뇌 질환,
즉 나이가 들어 몸의 기관이 노화하면서 발생하는 뇌 질환이다.
뇌의 인지 기능에 이상이 생기면 일상생활이 어려워진다.
그런 점에서 한국전자통신연구원(ETRI) 복합지능연구실의 노년층 치매 예측 인공지능(AI) 기술 개발은 주목할 만하다.
치매를 조기에 진단해 예방할 수 있다면
우리는 훼손되지 않은 마음과 생각으로 이 세상 그리고 가족들과 마주할 수 있을 테니 말이다.
* 치매(Dementia)가 인류의 기록에 처음 등장한 것은 서기 600년경으로, 세비야 대주교 성 이시도르가 그의 책 <어원학(Etymologies)>에서 처음 사용했다고 알려져 있다.

AI 활용한 치매 조기 예측 기술 개발

연구진이 노년층 음성 발화 분석 시스템의 인공지능 치매 예측 기술을 설명하고 있는 모습

치매의 한자(癡呆)는 두 글자 모두 어리석다는 뜻을 담고 있다. 여기서 어리석다는 것은 뇌에 문제가 생겼다는 것이다. 즉 치매는 대뇌 신경 세포의 손상 따위로 말미암아 지능, 의지, 기억 따위가 지속적이고 본질적으로 상실되는 병이다. 주로 노인에게 나타나는데 현재로선 발병하고 나면 되돌릴 수 없고, 명확한 치료법을 찾기도 어렵다.

그런 점에서 지난 8월 발표된 ETRI의 연구 결과는 각별히 주목할 만하다. 이 연구는 국가과학기술연구회의 창의형 융합연구사업 「노년층의 일상생활 발화 빅데이터 구축을 위한 AI 기반 퇴행성 뇌기능 저하 평가 기술 개발」 과제로 진행됐다. 이번 연구를 주도한 복합지능연구실은 음성처리 분야에서 축적된 AI 기술과 음성, 텍스트 및 영상 멀티모달 기술을 바탕으로 디지털 치료제 같은 헬스케어 분야까지 연구를 확장하고 있다.

연구실은 이번 연구를 통해 AI 기술을 활용하면 일상생활의 대화 등을 통해 입력되는 노년층의 음성 발화(發話)를 분석해 치매 전 단계인 경도인지장애* 및 치매 고위험군을 평가하고 예측할 수 있다는 사실을 밝혀냈다. 음성 발화는 기억, 의도, 주의 집중 등 ‘인지 기능’과 음운, 통사, 의미 등 ‘언어 생성 기능’, 호흡과 조음, 발성 등의 ‘구어 운동 기능’이 순차적으로 작용하는 복합적인 과정이다. 한 사람의 음성에 이토록 다양한 기능이 담겨 있는 만큼, 발화된 음성을 분석하면 경도인지장애나 치매 환자에게서 나타나는 인지, 언어, 운동 능력의 저하를 조기에 판단하고 예측할 수 있다는 것이다.
* 기억력이나 기타 인지 기능의 저하가 객관적인 검사에서 확인될 정도로 뚜렷하게 감퇴한 상태지만, 일상생활을 수행하는 능력은 보존된 상태를 말한다. 경도인지장애 환자 중 매년 10~15%가 치매로 진행된다.

최고 성능을 획득한 연구실 연구 성과

AI 기술을 활용해 노년층의 치매를 조기에 예측하는 이번 연구는 기존의 음성, 텍스트 분석 기술에 더해 세계 최초로 대형 언어 모델(LLM)을 결합해 진행됐다. 연구실은 이를 기반으로 영국 에든버러 대학과 미국 카네기 멜런 대학에서 주최한 ADReSSo 챌린지 데이터 세트에 참여했다. 이 챌린지에서 연구실은 기존의 최고 기록이던 85.4%를 뛰어넘어 87.3%의 최고 성능을 획득했다. 이 챌린지는 치매처럼 자동 예측이 어려운 사회적·의학적 문제를 탐지하고자 마련된 대회로 표준화된 음성 데이터 세트를 기반으로 다양한 테스트를 진행해 치매를 인식하는 데 가장 좋은 성과를 가려내고 있다.

이러한 연구실의 성과는 2024년 2월 ETRI 저널에 게재됐고, 이후 미국과 독일 등의 다양한 업체로부터 상용화 가능성 문의를 받는 등 높은 관심을 받고 있다. 연구 성과를 바탕으로 연구실은 일상생활 대화 과제를 중심으로 한 음성 발화 입력을 통해 경도인지장애 고위험군을 예측하는 태블릿 기반의 앱 개발을 완료하기도 했다.

노인복지센터 등과 연계해 ETRI의 노년층 음성 발화 분석 시스템을 실증하고 있는 모습

치매 예방의 새로운 길 열어

노년층은 특히 경도인지장애 및 치매 고위험군에서 흔히 나타나는 부정확한 발음, 사투리 발화 등으로 인해 분석에 어려움이 따른다. 연구실은 이를 축적된 음성 및 멀티모달 AI 기술로 극복했다. 실제 수요자인 노년층의 사용자 편의성 및 정확도 개선에 주안점을 두고 개발했고, 한국전기연구원과 연계해 노인복지센터 등에서 실증을 계획 중이다. 복합지능연구실의 강병옥 책임연구원은 “보건소를 직접 찾아 선별검사를 받는 기존 방식에 비해, 스마트기기를 통한 대화 기반의 검사 방식은 지속적·주기적 모니터링이 가능하다는 장점이 있다”며 이번 연구의 의미와 가능성을 강조했다. 연구실이 개발한 태블릿 기반의 앱을 스마트기기에 적용해 지역이나 노인복지센터 등에 배포하면, 거동이 불편한 노년층이 보건소를 일일이 찾지 않아도 스마트기기를 활용해 좀 더 간편하면서도 효과적으로 검사받을 수 있는 셈이다.

연구진은 본 기술을 통해 많은 치매 고위험군 노년층이 조기에 경도인지장애 여부를 확인할 수 있고, 초기부터 지속적인 관리를 통해 치매로 진행을 최대한 늦출 수 있다고 기대한다. 그렇게 되면 초고령 사회의 가장 심각한 문제 중 하나인 치매를 해결하는 데 큰 도움이 될 것이다.

이번 연구 성과는 AI와 의료 기술의 융합을 통해 치매 예방 및 조기 진단의 새로운 길을 열었다는 평가를 받고 있다. 향후 상용화를 통해 치매 치료를 위한 국가, 사회적 비용 절감 및 글로벌 디지털 치료제 시장에서도 큰 반향을 일으킬 것으로 전망된다.