메모리 중심 컴퓨팅 시스템으로
건강을 찾다
ETRI는 과학기술정보통신부 ‘메모리 중심 차세대 컴퓨팅 시스템 구조 연구’ 과제의 일환으로
유전체 분석에 특화된 메모리 중심 컴퓨팅 시스템을 개발했다.
이 기술은 기존 대비 28%의 성능 향상이라는 성과를 이루어
기존 서비스 소요 시간이 약 10개월 걸렸던 것을 약 7개월로 단축했다.
유전체 분석은 사람의 유전 정보를 해독해 개인의 질병 위험도, 영양과 운동의 상호작용 등을 알 수 있다. 하지만 아직 분석 서비스를 대중화하기에는 검사 단가가 비싸고 처리하기 위한 데이터 양도 커서 분석, 저장에 많은 비용이 필요하다.
인간의 DNA는 30억 개 염기들의 서열로 이루어져 있다. 차세대 염기서열분석을 사용하면 인간 DNA를 수십~수백 배수로 읽어 분석하기 때문에 이 역시 이동하고 저장하는 데이터양이 매우 크다.
그간 유전체 분석은 주로 메모리를 제한적으로 사용하되 연산을 많이 하는 프로세서 중심 컴퓨팅 기술을 주로 사용했다. 하지만 유전체 분석처럼 대용량 데이터를 처리할 때는 구조적으로 과부하가 걸려 성능 저하로 인한 시스템이 마비되는 병목 현상이 일어나는 경우가 많아, 데이터 처리에 시간과 노력이 많이 든다는 단점이 있었다.
이에 ETRI는 유전체를 분석하는 차세대 염기서열분석(NGS, Next Generation Sequencing)에 특화된 메모리 중심 컴퓨팅 하드웨어 및 소프트웨어 개발에 성공했다. 이 메모리 중심 컴퓨팅 기술은 대규모 메모리를 활용해 병목 현상을 극복했다.
ETRI가 자체 개발한 하드웨어 장치인 MOCA(Memory-Oriented Computing Architecture)는 대규모 메모리를 시스템에 장착할 수 있도록 만들었다. MOCA는 메모리 연결망(Gen-Z Protocol: CPU, 메모리, 가속기 등 다양한 장치를 메모리 시멘틱으로 접근할 수 있는 프로토콜 표준)을 통해 공유 메모리 풀을 구성하고 컴퓨팅 모듈 간 공유할 수 있도록 하는 하드웨어 및 소프트웨어 기술이다. 데이터 처리 중간 과정에서 하드디스크나 SSD 등을 활용할 필요가 없게 만든 것이 MOCA의 핵심이다.
또한 연구진은 유전체 분석 과정 중 가장 오랜 시간이 걸리는 염기 서열 정렬 단계에서 대규모 메모리를 활용하여 2배 이상 빠르게 처리할 수 있는 소프트웨어를 개발해 분석 효율을 높였다.
ETRI는 GC녹십자지놈과 협력해 기술 성능도 검증했다. 그 결과, 기존 시스템에 연구진이 개발한 하드웨어를 적용하면 전체 분석 성능을 16% 높일 수 있으며 하드웨어와 소프트웨어를 동시에 적용하면 성능을 25%까지 향상할 수 있음을 입증했다.
이 기술은 암 발병률, 태아의 장애 유무 등을 미리 알아보거나 전염병의 변이 파악, 치료제 개발 등을 하기 위한 시스템에 적용할 수 있다. 덕분에 분석 기관이나 제약회사 등에서는 서비스 개발비, 진단 시간을 낮추고 병원 등에서 환자 맞춤형 협진 체계를 구축하며 국민 건강 증진과 사회적 부담을 줄이는 데 많은 도움이 될 것으로 전망된다.
ETRI는 본 성과와 관련해 국제전기전자공학회(IEEE)가 발간하는 학술지를 비롯해 논문 26편, 국내외 특허 12건 출원, 기술이전 2건을 진행한 바 있다.
향후 ETRI는 2단계로 시작되는 ‘메모리 중심 차세대 컴퓨팅 시스템 구조 연구’ 과제에서 시스템을 고도화하고 의료기관을 확대해 유전체 분석 정확도를 더욱 높이는 한편, 암이나 당뇨병 등 다른 질병에도 적용 범위를 확대할 계획이다.
ETRI는 수년간 국내외 학계, 제약사와 함께 협력하면서 풍부한 유전체 분석 기술과 경험을 토대로 대용량 메모리를 활용할 수 있는 효율적인 컴퓨팅 기술을 축적하면서 본 성과를 낼 수 있었다. 향후 ETRI의 메모리 중심 컴퓨팅 기술로 밝고 건강해질 미래를 기대한다.