메인콘텐츠 바로가기

ETRI Webzine

VOL.132
June 2019

Special  ____  빅데이터로 예측하는 인간의 질병

빅데이터로 예측하는
인간의 질병

과거 전쟁과 더불어 질병과 전염병은 인간의 생명을 위협하는 최대의 적이었다. 물론 그 위험이 오늘날에도 완전히 사라진 것은 아니다. 그러나 현재 우리는 질병과 전염병을 예방하고, 치료할 수 있는 시대에 살고 있다. 그리고 최근 몇 년 사이에는 의학 분야에 빅데이터 기술이 도입되면서 예방의학 분야의 판도가 크고 빠르게 변화중이다. 빅데이터 분석을 통해 이젠 질병을 예측하고, 맞춤형 치료가 가능한 세상이 열리고 있다.

페이스북 공유하기페이스북 공유하기 트위터 공유하기트위터 공유하기 카카오톡 공유하기카카오톡 공유하기
빅데이터로 예측하는 인간의 질병

빅데이터, 의료의 패러다임을 흔들다

2017년 통계청이 발표한 우리나라 남녀의 평균 수명은 각각 79.7세와 85.7세다. 인간의 평균 수명이 40~50세였던 100년 전보다 수명이 2배 이상 늘어난 셈이다. 2017년 영국의 임페리얼칼리지 연구팀의 연구 결과에 따르면, 인류의 평균 수명 기대치가 곧 90세를 넘게 될 것으로 보고 있다. 구체적으로는 2030년 한국에서 태어날 여성들의 기대 수명이 사상 처음으로 90세 장벽을 깰 것으로 전망했다. 그러나 평균 수명이 늘어난 만큼 질병에 노출되는 시기는 더욱 길어진다. 이에 의학의 패러다임 또한 치료 중심에서 예방중심으로 이동하며, 예방의학의 중요성이 점점 커지고 있다. 질병을 예방하는 것만으로도 막대한 사회적 비용을 줄일 수 있고, 길어진 우리 삶의 질을 향상시킬 수 있기 때문이다. 그리고 최근 몇 년 사이 빅데이터 시대가 열리면서 질병을 예측하고, 맞춤형 치료가 가능한 세상이 열리고 있다.
미래 의료 패러다임으로는 ‘정밀’, ‘예측’, ‘예방’, ‘개인 맞춤형’ 의료가 꼽히면서, 많은 나라가 국가 주도로 의료 빅데이터 프로젝트를 진행하고 있다. 먼저 미국의 전 대통령 버락 오바마는 지난 2015년 신년 연설에서 정밀의학추진계획(PMI, Precision Medicine Initiative)을 발표한 바 있다. 이를 위해 환자 유전체 정보를 비롯한 진료 정보와 같은 빅데이터를 활용해 개인별 맞춤 치료를 제공하겠다는 것이다. 이를 통해 획기적인 의료비 지출 감축을 추진하겠다고 발표했다. 그리고 그 해 100만 명의 유전자 분석을 통해 2016년 캔서 문샷(Cancer Moonshot) 프로젝트를 진행했다. 그 결과 암을 비롯한 다양한 질병 관련 데이터를 확보할 수 있었다.
영국 정부는 2013년 보건의료 빅데이터 통합센터(HSCIC, Health Social Care Information Centre)를 설립해 2조 원의 예산을 투입했다. 그리고 희귀 질환자와 암 환자, 환자 가족들의 유전체인 게놈(Genome) 10만 개를 분석하는 ‘게노믹스 잉글랜드(Genomics England)’프로젝트를 진행했다. 10만 명에 달하는 암 환자들을 대상으로 게놈을 완벽하게 분석해 질병 예방에 나서겠다는 계획이다. 핀란드 또한 지난 2015년부터 데이터의 소유권을 기업에서 개인으로 옮기려는 국가 프로젝트 ‘마이 데이터(MY DATA)’를 시행 중이다. 그 결과, 핀란드에선 방대한 진료 빅데이터를 활용할 수 있게 되었다.

Cancer Moonshot
유방암, 폐암, 전립선암, 난소암, 뇌암, 후두암 등 20개의 암종에 대해 24개월 동안 다수의 무작위배정 임상 1~2상 시험을 디자인하고, 추진하는 프로젝트

우리나라 의료 빅데이터 현황

국내에서도 물론 정부 주도의 헬스케어 빅데이터 구축 및 활용을 추진 중이다. 먼저 과학기술정보통신부, 국가정보화전략위원회, 한국기술기획평가원, 한국과학기술정보연구원, 국민건강보험공단, 건강보험심사평가원이 헬스케어 빅데이터 구축 활용을 추진하고 있다. 과학기술정보통신부와 보건복지부는 지난 2017년 6월, 고려대의료원을 연구사업자로 하는 국가전략프로젝트 정밀의료사업단(K-MASTER), 정밀의료 병원 정보 시스템 P-HIS개발 사업단을 본격적으로 출범시켰다. 고려대의료원은 사업단 총괄기관으로서 의료 IT 분야에서 선도적인 기술력을 보유한 국내 대형병원들과 손잡았다. 이를 통해 암 진단 및 치료를 위한 유전자 분석 플랫폼을 완성하여 치료의 통합 솔루션을 구축하는 것을 목표로 한다.
한편 ETRI는 지난 2018년 7월, 단국대학교와 의료분야에 인공지능 기술을 적용한 정밀의료연구를 위해 연구 협력에 나섰다. ETRI는 그동안 빅데이터, 인공지능 기술을 바탕으로 다양한 변수로 구성된 데이터를 분석하는 ‘자가적응분석 엔진 기술’을 개발해 왔다. 이에 의료용 데이터가 풍부한 단국대학교 병원과의 협력을 통해 의료분야에 시험 및 검증한다는 계획이다. 현재 ETRI는 새로운 기계학습 모델과 인지적 데이터 분석 알고리즘을 적용한 의료데이터 분석엔진 ‘사이버 디엑스(CyberDx)’를 바탕으로 질병 위험도 분석 연구를 진행 중이다. ‘사이버 디엑스’에는 머신러닝 기술을 이용한 자가분석 엔진 기술과 자가적응형 엔진 기술, 개인 맞춤형 질병 진단 분석 기술 등이 적용됐다. 아울러 연구진은 EMR(Electronic Medical Record)과 같은 진료 데이터를 분석하면 환자별 개인 특성에 맞는 모델을 만들 수 있다고 설명했다.

사이버 디엑스
(CyberDx)

새로운 기계학습 모델과 인지적 데이터 분석 알고리즘을 이용해 사람들의 질병 위험도를 분석해 주는 인공지능 의료데이터 분석엔진

예방의학의 새 시대

빅데이터의 핵심은 예측에 있다. 빅데이터 예측 기술은 엄청난 양의 데이터에 수학을 적용해 확률을 추론하는 노력이다. 실제로 캐나다의 온타리오 병원에서는 미숙아 모니터링 장비를 통해 빅데이터를 수집해 미숙아의 질병 감염 여부를 빠르게 판단하고 처방할 수 있었다. 미숙아 실에 설치된 각종 모니터링 장비에서는 인큐베이터 미숙아들의 혈압, 체온, 심전도와 혈중 산소 포화도 등 수 많은 생리학 데이터가 발생한다. 하지만, 이러한 정보는 버려지고 진찰 당시 상황만 차트에 기록되어 사용되어 왔기 때문에 감염 여부를 판단하기 부족했다. 이에 온타리오 병원은 미숙아의 혈압, 체온, 심전도, 혈중산소 포화도 등의 생리학 데이터를 근거로 IBM에서 지원하는 빅데이터 분석 솔루션을 활용해 패턴을 찾아냈다.
지난 2015년 기승을 부린 메르스를 예로 들어보자. 빅데이터 분석은 메르스와 같은 전염병의 확산 과정을 푸는 열쇠가 될 것으로 전망한다. 빅데이터 기반의 분석 기술을 활용하면, 메르스 환자들이 이동한 경로와 지역 등을 파악할 수 있기 때문이다. 메르스 환자의 병원 방문 일자와 진료기록 등 관련 데이터를 분석하면, 그들의 이동 경로와 밀접 접촉자 등 격리 대상을 훨씬 빨리 알아낼 수 있다. 또 빅데이터 분석결과를 바탕으로 지도에 해당 정보를 표시하면, 각 지역의 발병 위험도와 확산의 흐름 등을 실시간 추적이 가능하다.
빅데이터에 기반한 질병 예측은 분명 현재의 의료수준을 몇 단계 업그레이드시켜 줄 것이다. 그러나 이에 따른 부작용도 있을 것이다. 많은 상황에서 데이터 분석은 예방이라는 이름으로 우리를 비슷한 사람들과 동일 집단으로 묶는 데 사용되고, 어쩌면 우리가 속한 집단에 따라 특징지어질 수도 있다. 예를 들면 한 보험 회사의 보험요율 산정표에는 “특정 50세 이상의 남성이 전립선암에 걸리기 쉬우므로 이 집단에 속한 사람들은 보험료를 더 부과해야 한다”고 자체 지침을 만들 수 있다. 아직 전립선암에 걸리지 않았는데 말이다. 또 야외 활동을 즐기는 사람들이나 위험 환경에서 일하는 근로자들은 사고의 위험에 노출되어 있다는 이유로 사무직 근로자들보다 보험료를 더 내야 하는 사람들로 분류될 수도 있다. 저명한 역사학자 유발 하라리는 그의 저서 <호모 데우스>를 통해 신이 된 인간의 미래에는 종교를 대신하여 데이터가 신흥 종교로 떠오를 것이라고 말했다. 다가올 빅데이터 시대의 인간은 갈수록 빅데이터의 결정에 의존하게 될 가능성이 크다는 것이다. 그러나 불완전한 기술은 잘못된 근거를 제공한다. 앞으로 빅데이터는 엄청난 양의 정보와 데이터를 바탕으로 분석과 예측 결과를 쏟아낼 것이다. 그러나 그 결과가 올바르지 않거나 왜 그러한 결과가 나왔는지 알 수 없다면, 많은 사회적 문제를 초래할 것이다. 따라서 빅데이터 예측 기술에 대한 보완뿐만 아니라 잘못된 분석에 대한 철저한 대비도 마련해야 한다. 결국, 기술을 이용하는 것은 인간이며 궁극적으로 빅데이터의 가치를 잘 활용하는 것도 인간의 손에 달린 것이다.