메인콘텐츠 바로가기


Interview

적절한 데이터를 찾아라!
데이터 표준을 주도하는 사람들

서비스표준연구실 하수욱 책임연구원

빅데이터가 중요하다는 것에는 모두가 공감한다. 하지만 빅데이터를 어떻게, 그리고 어디에 활용할 것인지에 대해서는 많은 고민이 필요하다. 빅데이터의 수집방법이나, 수집된 자료를 가공하는 것, 그 속에 숨어있는 인사이트를 도출해내는 것은 세상을 선도하고 있는 수많은 기관 및 기업의 고민이다. 그 고민의 출발은 데이터를 분석할 적절한 기준을 정하는 것부터 시작된다. ETRI는 그 고민 끝에 국제전기통신연합(ITU) 표준화회의에서 국제표준을 승인받았다. 데이터 국제 표준을 주도하는 ETRI 서비스표준연구실 ‘하수욱 책임연구원’을 함께 만나보자.

Q.01

먼저, ‘우수연구자상’을 수상하셨습니다.
소감 한 말씀 부탁드립니다.

ETRI는 지난 5일 본원 7동 대강당에서 창립 42주년 기념식을 가졌다. 올해의 연구자상을 비롯해 기술대상, 신입직원상 등 우수성과에 대한 직원 포상을 실시했다. 하수욱 책임연구원은 직할부서별 최고의 영예인 ‘우수연구자상’을 다른 동료들과 함께 받았다. 인터뷰 첫 질문으로 그에게 소감을 묻자, 그는 겸손을 표하며 조곤조곤 답변을 이어갔다.
“운이 좋았다는 생각이 첫 번째로 듭니다. 아무래도 저희 서비스표준연구의 업무가 단기간 실적이 나는 일이 아닙니다. 표준화는 빠르면 2년 길게 3~5년 축적되어야 실적이 나거든요. 이 때문에 각 연구자마다 사이클이 있어요. 어떤 해는 실적이 많이 나기도하고, 어떤 해는 실적이 없기도 합니다. 운이 좋게도 제가 다른 분들에 비해 실적이 많이 났을 때 우수한 평가를 받게 됐다고 생각합니다.”
운이 좋아 ‘우수연구자상’을 받았다고 말하는 그의 연구부서는, 지난해 10월 스위스 제네바에서 열린 국제전기통신연합(ITU) 표준화회의에서 빅데이터의 유통 활성화를 위한 국제표준을 승인받았다. 이로써 4차 산업혁명의 핵심기술로 평가받는 빅데이터와 클라우드 분야에서 ETRI 연구진이 국제표준을 주도하게 된 것이다. 그 성과의 중심에는 서비스표준연구실의 이강찬 실장, 인민교 책임연구원 그리고 하수욱 책임연구원의 노고가 고스란히 담겨있었다.

Q.02

빅데이터 유통지원 표준개발 및 표준 특허
창출이란 무엇인가요?

“데이터 유통을 쉽게 설명하자면, 데이터를 공급하는 쪽이 있고 데이터를 사고자 하는 쪽이 있어요. 그 둘 중에서 공급하고자 하는 사람은 내 데이터가 어디에 쓰일지 모르고, 사고자 하는 입장에서는 도대체 어떤 데이터를 어디에 쓸 수 있는지 알고 싶은 거죠. 판매자는 친절하지 않고, 구매자는 절실할 때 유통이라는 측면에서 수요와 공급을 매칭해 적절한 데이터를 찾아주는 것입니다.”
이번에 승인된 빅데이터 관련 표준은 빅데이터 생태계를 기반으로 빅데이터 교환 유형을 정의한다. 아울러 데이터 및 서비스 제공자, 빅데이터 소비자 간 데이터 교환에 요구되는 데이터 등록, 검색, 전송, 품질 및 데이터 소유권 관리, 개인 정보 보호에 필요한 기능 요건들을 상세하게 기술했다. 이를 통해 국가적으로 추진하고 있는 공공 데이터 개방과 빅데이터 유통 생태계 조성을 위한 표준화 기반을 확보한 셈이다. 또한, 연구진은 한국특허전략개발원(KISTA)과 협업을 통해 관련 국제특허를 이미 출원한 바 있다. 이번 국제표준 승인으로 2건의 표준특허도 추가 확보했다.
“이번 특허중 하나는 데이터를 판매하려는 입장도 아니고 구매하려는 입장도 아닌 제3자가 설계서를 등록하는 것입니다. 양쪽의 입장을 보고, 기존에 있는 데이터들을 어떤 형태로 가공해서 소비자에게 전달할지 설계서를 등록하는 것입니다. 말하자면 소비자는 설계서를 바탕으로 구매를 요청하면, 제3자는 요청을 받아 기존 데이터를 가공해서 전달해 주는 중간역할을 하는 핵심 내용입니다. 두 번째는 이렇게 해서 전달이 됐을 때 과연 내가 원했던 데이터인지 ‘입증’하는 것입니다. 실제로 이 데이터가 소비자에게 필요한지, 데이터 스펙에 쓰여 있는 내용과 일치한 지, 구매한 데이터가 정확히 갔는지 확인하는 것입니다.”
연구진은 그동안 빅데이터 출처 관리를 위한 요구사항, 빅데이터 메타데이터 프레임워크 및 개념 모델, 빅데이터 기반 클라우드 컴퓨팅 서비스 아키텍처, 데이터 저장소 연합 등 주요 표준 개발을 주도해 왔다.

Q.03

‘빅데이터로’ 마음을 읽을 수 있을까요?

데이터가 많아지면 첫 번째로 패턴을 발견한다. 이런 패턴은 증상을 의미한다. 최근 구글은 사진 검색 시 사진 속 표정을 지은 사람이 행복한지 우울한지 가려냈다. 결국 데이터들이 정말 많아졌을 때, 그것들을 상당히 일반화해서 예측하는 것이다. 그렇다면 사람의 마음도 예측해서 읽을 수 있을까?
“카메라를 들이대고 이 사람의 마음을 읽으라고 하는 것은 현재 불가능하겠죠. 하지만 100명의 사진을 찍고, 여기서 행복한 사람은 몇 퍼센트일까? 라고 묻는다면 근사치는 맞출 수 있어요. 모든 데이터를 연구하시는 분들은 결국 공통셋과 트렌드를 찾고 예측을 하는 것이지 어떤 것을 직관적으로 읽어보라고 하는 것은 어려워요.”
그의 말대로 데이터는 패턴이다. 사람의 마음을 읽기 위해서는 수집할 수 있는 모든 데이터를 수집하고, 어마어마한 데이터를 토대로 분석해야 한다. 분석하기 위해서는 최소 백만 개의 데이터를 필요로 한다. 현실적으로 그런 데이터를 구하는 것도 불가능에 가깝다. 이는 기술적인 문제뿐만 아니라 프라이버시도 분명 얽혀 있기 때문이다.
“마음을 읽어보라고 하면 본인도 본인 속을 모를 때가 있는데, 이를 빅데이터가 정확히 읽어낼 수 있을까요? 어려울 것 같아요. 하지만 일부는 가능할 수 있겠죠. 거짓말 탐지기처럼 심박 수가 증가하거나, 체온이 증가할 때마다 참인지 거짓인지 판별하는 것처럼 성향을 판별할 수 있어요.”

Q.04

박사님의 최종 목표는 무엇인가요?

ETRI는 이번 성과로 빅데이터 유통 생태계의 활성화를 통한 데이터 공급 확대를 위한 초석을 마련하게 됐다. 신규 표준화 승인을 통해 하수욱 책임연구원의 다음 목표가 궁금해지는 부분이다.
“장기적인 목표를 가지고 일하지는 않아요. 그 대신 꼭 필요한 사람이 되어야겠다는 생각을 합니다. 연구 환경도 그렇고, PBS(연구과제중심제도)다 보니 과제를 베이스로 할 일이 규정될 때가 있어요. 실제 제가 전문성이 있는 부분들을 연구하면 정말 좋지만 방향이 약간씩 틀어지면 맞춰가기도 해야 되죠. 주어진 역할이 있으면 마지못해 하는 것이 아니라 지금 주어진 역할을 충실히 해내는 것이 제 목표입니다.”

Editor epilogue

ETRI는 이번 표준을 제안으로 빅데이터 및 클라우드 컴퓨팅 분야 국제표준 주도국으로서의 역할을 충실해 나가고 있음을 확인했다. 4차 산업혁명 시대에 빅데이터를 기반으로 삶의 질을 향상시키는 것은 모두의 바람이다. 서비스표준연구실은 4차 산업혁명을 주도할 IDX 핵심 기술 관련 시장 선점을 위해 연구에 박차를 가하고 있다.

TOP