페이스북, 트위터, 미투데이 등 SNS(소셜 네트워크 서비스) 사용자가 점점 늘어나면서 이들 계정의 연계를 통한 개인의 정보보호 침해가 심각할 수 있음을 나타내 주는 연구가 국내 연구진에 의해 처음으로 추진되어 관심을 끌고 있다.
ETRI 사이버보안연구단은 『빅데이터 개인정보 분석 기술
』을 개발, 페이스북 657만 개, 트위터 277만 개 등 한국인 SNS 이용자 계정 934만 개를 대상, 개인정보 노출현황을 분석하고 그 결과를 발표했다.
연구진은 실제 SNS 데이터를 직접 수집하고 가공, 개인정보 추출, 위험도 분석 프로그램 등을 통해 결과를 얻었으며 관련 기술은 개인정보 탐지 솔루션 업체에 기술이전을 준비 중이다.
이번 조사를 통해 연구진은 SNS를 사용하는 사람이 본인의 세부정보를 계정에 올림으로써 나타나게 되는 심각성을 크게 염두에 두지 않는 것으로 나타났다고 밝혔다.
ETRI 연구진은 SNS 계정에 들어있는 개인정보들을 서로 연결하게 되면 이른바 ‘신상털기’가 쉬워져 개인의 프라이버시 침해는 물론, 피싱 사기나 타켓광고, 마케팅 등에 악용될 소지가 높다고 설명했다.
이번 연구결과로 페이스북의 경우 성별(92%), 고등학교(47%), 혈액형(40%), 관심사(19%), 좋아하는 음악(14%) 순으로 개인 신상 정보가 노출된 것으로 조사됐다.
아울러 출신학교나 거주지역 등과 같은 직접 그 사람이 누구인지 알 수 없는 ‘비식별 정보’를 조합해, 개인을 특정할 수 있는 경우도 분석해 보았다. 그 결과, 주민등록번호나 ID, 계좌번호 등과 같은 ‘식별정보’가 아닌 이름-고등학교 조합만을 통해서도 식별되는 경우는 226만 명(34%)에 달했다. 여기에 대학교 정보를 추가할 경우 297만 명(45%)의 식별이 가능했다.
한편, 트위터의 경우 이름(69%), 지역(45%), 직업 (33%) 순으로 노출된 정보가 많았으며, 전체 277만 개 계정 중에서 2개 이상의 개인정보가 노출된 계정 수는 134만 개, 3개 이상 노출된 경우도 21만 개에 달했다.
종합적으로 페이스북과 트위터를 합친 934만 개 계정 중에서 3개 이상 정보가 노출된 계정 수는 386만 개로 약 41%에 달한 심각성도 보여줬다.
따라서 트위터와 페이스북에 노출된 이름, ID 등 간단한 정보를 이용, 최소 17만 개의 트위터 계정과 페이스북 계정을 서로 연결할 수 있는 것으로 파악되었다.
이번 조사 분석은 ETRI에서 개발한 ▲SNS 정보 자동 수집 기술 ▲개인정보 탐지 기술 ▲정보조합을 통한 식별 가능성 분석 기술 등과 같은 빅데이터 개인정보 분석 기술을 사용해 수행되었다.
아울러 이러한 조사 분석 규모는 기존에 24만 명을 조사한 해외 사례를 능가하며, 국내에서 이러한 대규모 조사는 최초라고 ETRI 측은 밝혔다.
이번 분석을 진행한 ETRI 인증기술연구실 최대선 박사는 “그동안 정보 하나하나를 조합해 개인을 식별하거나, 계정을 상호 연결해 더 많은 정보가 노출될 수 있는 위험성이 많이 지적되어 왔는데, 이번 분석은 실제 데이터를 통해 그 심각성을 확인한데 큰 의미가 있다”고 말했다.
한편, 이러한 위험으로부터 이용자의 개인정보를 보호하기 위해서는 상기 빅데이터 개인정보 분석 기술의 고도화와 함께 ▲광범위한 인터넷 ▲빅데이터 개인정보 노출 탐지 ▲추론을 통한 미공개 정보 유추 가능성 분석 ▲계정 연결을 통한 식별 위험 분석 ▲위험도에 따른 개인정보 실시간 필터링 등의 기술이 추가로 개발되어야 한다고 ETRI 측은 밝혔다.
본 연구 내용은 한국정보보호학회 논문지 10월호에 게재될 예정이다.