SNS에서
쏟아지는 정보,
수집하고 분석해서
유용한 가치로 만들다
디지털 환경이 발전하면서, 소셜미디어가 전 세계 소통 수단으로 급부상했다. 소셜미디어를 통해 전 세계인이 소통하면서, 방대한 양의 문자 동영상 등의 데이터가 쏟아지기 시작했다. 이는 가늠할 수 없을 정도의 방대한 양이다. 이렇게 쏟아지는 데이터는 쓸모없을까? 잘만 활용하면, 전 세계인의 이슈를 파악할 수 있지 않을까? 바로, 이를 위해 필요한 기술이 ‘빅데이터 마이닝’이다. 빅데이터 마이닝은 소셜미디어의 이슈를 탐지하고 분석하여, 유용한 ‘자원’으로 만드는 기술이다.
소셜미디어를 통해
생성되는 데이터
인터넷과 모바일을 통해 전 세계는 끊임없이 소통한다. 소통은 데이터를 생성한다. 블로그, 페이스북, 유튜브 등 세계 곳곳의 데이터망에 저장되고 있다. 전문가들은 정보화 사회에서 데이터만큼 중요한 자산은 없다고 말한다. 바로 이 데이터를 통해 다양한 부가가치를 생성할 수 있기 때문이다. 예로, 데이터를 통해 어떤 사람이 어떤 분야에 관심이 있는지, 자주 찾는 정보는 무엇인지, 그리고 사람들은 현재 무엇에 관심이 있는지 파악할 수 있기 때문이다. 때문에 부가가치가 높은 데이터를 쓸모 있고 가치 있게 만들기 위해서는 ‘분석’하는 기술이 필요하다. ‘빅데이터 마이닝(Big Data Mining)’이다.
소셜미디어의
이슈를 탐지하는 기술
빅데이터 마이닝은 소셜 미디어 즉, 트위터‧블로그‧온라인 뉴스를 대상으로 사람들이 어떤 이슈에 관심이 있는지 파악하고, 어떤 감성적인 반응을 보이는지 분석하는 기술이다. 소셜 미디어에 담긴 사회 현상을 분석하는 기술인 셈이다.
ETRI는 언어처리기술을 기반으로 하여, 소셜미디어 분석을 시작했다. 소셜미디어의 복잡한 데이터를 이해하고 분석해 유용한 지식을 추출하는 기술이다. 개발한 기술은 ‘소설 빅데이터 기반 이슈 탐지-모니터링 및 예측분석 기술’로, 소셜웹의 폭발적인 성장으로 생산된 빅데이터를 언어분석 기반 정보추출을 통해 탐지한다.
또한, 소셜웹에서 변화하는 이슈를 모니터링해, 전문가가 이를 기반으로 의사결정할 수 있도록 돕는 기술이다. 특히 본 기술의 강점은 자신의 감정을 표현한 문장도 분석할 수 있다는 것이다. 감정을 표현한 문장에 감성분석 기술을 접목, 전반적인 호감도, 여론 등을 추론할 수 있다. 특히 긍정과 부정의 양극성을 좀 더 세분화하여, 분석하여 제공한다. 기술은 긍정, 부정의 의견분석뿐만 아니라, 세계 최다인 20개로 세분화하여 분류할 수 있다. 긍정 의견 중에서도 ‘감동’, ‘만족’ 등의 세부 감성별로 의견을 분류할 수 있다. 부정 의견은 ‘싫어함’, ‘화남’ 등을 분류할 수 있다. 따라서 어떤 이슈가 발생했을 때, 대처하는 방향이 달라질 수 있으므로 보다 정확하게 모니터링할 수 있는 장점이 있다.
다양한 사업화를이뤄내다
기술개발 이후, 감성정보 및 작성의도를 파악해 광고를 선별-정제하는 기술을 개발했다. 이후 온라인 광고회사로 국산 원천기술 도입 후 사업화를 통해 맞춤형 기술이전도 추진했다. 사업화 지원 등을 통해 (주)인터웍스미디어 ‘맞춤형 광고 기술’ 상용화에 성공했다.
사업화 후 KBS 미디어, 중앙일보, 한국경제 등 국내 40여 개 언론사 네트워킹 서비스를 진행했다.
연구진은 기술개발 완료 후, 아홉 개 기업에 원천기술을 기술이전했으며 개발결과물의 직접 사업화를 위해 연구소 기업 (주)마인즈랩을 2014년 1월에 설립하고, ‘MINDS INSIGHT’ 등 빅데이터 분석 서비스 3총을 출시했다. 본 기술은 산업군‧업종별 다양한 기업에 시장 트렌드를 분석‧예측하는 데 적용, 기업이 브랜드를 홍보하고 새로운 사업을 시작하기 위한 다양한 정보를 제공해주고 있다.
이를 바탕으로 분석한 다양한 정보로 기업, 브랜드 홍보 및 광고를 위한 전략 구축 및 빅데이터 마케팅과 컨설팅을 제공하는 빅데이터 분석 관련 사업화를 추진했다. 본 기술은 새로운 제품이나 상품을 기획할 때, 사용자의 수요를 조사하고 분석하는 데 유용하게 활용되고 있다.