ETRI

VOL. 171 March 2021

TOP
Focus on ICT

딥러닝 기반 휴먼 행동 인식 기술,

거대한 변화의 물꼬를 트다

생활 속 ICT 이야기

1971년, 대한민국 최초로 12개의 CCTV가 서울 주요 교차로에 설치되었다.
이후 40년이 흐르는 동안 CCTV는 양적으로, 또 질적으로 발전하며 치안 유지에 있어 필수 불가결한 존재가 되었다.
그러나 CCTV의 한계는 명확하다. 바로 사람의 모니터링이 필요하다는 점이다.
이런 한계점을 뛰어넘어 영상 데이터만으로도 이상 행동 및 일상 행동을 감지할 수 있는
데이터 딥러닝 기반 휴먼 행동 인식 기술이 주목받고 있다.

딥러닝 기반 휴먼 행동 인식 기술 관련사진1

CCTV, 눈이 아닌 머리가 되다Intelligent cctv

지금까지 CCTV 역할은 우리 눈이 되어주는 것에 그쳤다. CCTV를 통해 여러 장소를 실시간으로 감시할 수 있게 되었으나, 위험을 인지하거나 범죄 해결의 실마리를 발견하는 등의 해석은 오롯이 사람의 몫이었다. 이러한 한계점을 뛰어넘어 사람처럼 사고하고 상황을 인지하여 스스로 위험이나 범죄를 예방하는 지능형 CCTV의 필요성이 대두되고 있다.

지능형 CCTV에 대한 수요는 세계적으로 증가하고 있다. 지능형 CCTV는 보안 서비스뿐만 아니라 재난재해 모니터링 서비스, 영유아 모니터링 서비스, 실버케어 서비스 등에 활용될 수 있기 때문이다. 글로벌 지능형 CCTV 시장규모는 2019년 236억 달러에서 2020년에는 264억 달러 규모로 성장했으며, 연평균 약 13% 성장하여 2025년에는 440억 달러 규모의 시장으로 성장할 것으로 전망된다. 우리나라 정부 역시 지능형 CCTV 산업을 ‘디지털 뉴딜’의 핵심산업으로 선정하고 육성지원 방안을 수립했다. 지방자치단체도 지능형 CCTV를 활용한 재난대응 시스템 구축에 나서는 중이다.

이런 상상을 가능하게 하는 지능형 CCTV의 상용화가 머지않아 보인다. 지능형 CCTV의 근간이 될 ETRI의 ‘딥러닝 기반 휴먼 행동 인식 기술’이 Pilot 단계1) 시작품 성능 평가 단계에 돌입했기 때문이다. 딥러닝 기반 휴먼 행동 인식 기술은 인공지능과 딥러닝 기능이 융합·확장된 지능형 영상분석 기술이다. 이 기술이 탑재된 지능형 CCTV는 사람의 동작, 자세, 위치와 상호작용하는 물체의 정보를 실시간으로 파악하여 배회, 침입, 싸움, 방화, 쓰러짐, 유기 등의 이상 행동을 감지할 수 있게 된다.

1) Pilot 단계
실제 환경(수요기업)에서 성능 검증이 이루어지는 단계.

딥러닝 기반 휴먼 행동 인식 기술 관련사진2

세계 최고를 향해 가는 ETRI 기술
world-class

ETRI의 딥러닝 기반 휴먼 행동 인식 기술은 크게 몇 가지 핵심 기술로 나뉜다. 첫 번째로 자세 인식 기술로 단순 자세 인식이 아닌 실시간으로 사람의 세부 자세 정보를 인식할 수 있다. 두 번째로 물체 검출 기술로 사람과 상호작용하거나 주변에 존재하는 사물을 인식할 수 있으며, 마지막으로 딥러닝 기반 포즈 추정 기술로 2D 영상에서 사람의 관절을 실시간으로 추적할 수 있다.

위 기술들은 다양한 영상 조건에서 행동 인식이 가능하다. 육안으로 인식 대상 행동이 구별되는 2D RGB뿐 아니라 3D, 열화상, 가상합성 영상 등을 적용할 수 있기 때문이다. 또한, 모니터링 대상의 이상 행동, 일상 행동, 건강 이상징후 행동 등 다양한 행동을 인식할 수 있어 행동 인식에 제약이 없다.

ETRI 기술은 세계 최고 수준의 포즈 추정 성능을 구현하고 있다. 이미 알려진 딥러닝 기반 포즈 추적 프로그램 OpenPose와의 비교 결과 정확도와 속도에서 모두 우위를 차지했다. 실제로 ETRI의 기술은 다양한 환경에서 발생하는 다수의 행동을 동시에 91.5%까지 인식할 수 있다. 이러한 기술력을 인정받아 현재 한국인터넷진흥원(KISA)에서 ETRI의 기술을 접목한 지능형 CCTV 솔루션에 대한 공인 인증을 진행 중이다.

딥러닝 기반 휴먼 행동 인식 기술 관련사진3

눈에 띄는 변화를 불러오다
changing

딥러닝 기반 휴먼 행동 인식 기술의 적용 범위는 지능형 CCTV에 그치지 않는다. 해당 기술이 산업의 흐름, 특히 코로나 19로 인한 시장의 변화에 부합하는 기술이기 때문이다. 코로나 19로 인해 비대면이 트렌드가 장기화될 것으로 예상된다. 각종 업계에서도 서비스의 질은 유지하면서 사람 간의 접촉을 최소화 할 수 있는 기술이 각광 받고 있다.

디지털 콘텐츠가 그 예다. 코로나 19 여파로 언택트 트렌드가 확산되면서 디지털 콘텐츠에 대한 수요가 꾸준히 증가하고 있다. 글로벌 디지털 콘텐츠 시장규모는 2018년 10,934억 달러에서 연평균 7.8%씩 성장해 2022년도에는 14,435 달러에 달할 것으로 전망된다. ETRI 기술은 디지털 콘텐츠의 질을 한 단계 더 끌어올릴 것으로 보인다. 특히, 게임이나 스포츠 등 체험형 콘텐츠를 비롯하여 에듀테인먼트 서비스, 정확한 동작 수행이 중요한 스포츠 시장에서의 활약이 두드러질 것으로 예상된다.

또한, 해당 기술은 소비자 행동 분석 서비스와 소비자 행동 분석에도 활용될 수 있다. 이미 글로벌 유통 기업들은 매장을 방문한 고객의 표정이나 제품을 체험한 고객의 인지 및 반응을 정확히 분석하는 기술을 도입해 매출 증대를 추진하고 있다. 딥러닝 기반 휴먼 행동 인식 기술은 쇼핑 경로 분석 및 고객 반응 분석에 활용되어 기업의 마케팅 전략 수립 및 제품 개발에 큰 도움을 줄 것으로 보인다. 이처럼, 딥러닝 기반 휴먼 행동 인식 기술은 눈에 보이는 기술은 아니지만, 지능형 CCTV, 커넥티드 로봇, 실감콘텐츠, 스마트공장, 스마트 시티 등 다양한 산업과 연계되어 거대한 변화의 흐름을 이끌 전망이다.

딥러닝 기반 휴먼 행동 인식 기술 관련사진4

본 내용은 ETRI 기술사업화플랫폼에 등재된
'다양한 영상 조건에서의 딥러닝 기반 휴먼 행동 인식 기술'을 인용해 구성하였습니다.

자세한 기술 문의 바로가기
  • 페이스북 공유하기
  • 네이버 공유하기
  • 카카오톡 공유하기