HWP문서[ETRI 보도자료] ETRI, AI 영상압축대회서 세계1위 성과_200618.hwp

닫기

Embargo

없음

배포일자 : 2020.06.18.(목)

배포번호 : 2020-28호

통신미디어연구소

미디어연구본부장

김흥묵(042-860-4939)

E-mail : hmkim@etri.re.kr

미디어연구본부

미디어부호화연구실

김연희(042-860-5407)

E-mail : kimyounhee@etri.re.kr

홍보부

홍보실장

정길호(042-860-0670)

E-mail : khchong@etri.re.kr

홍보실

행정원

정이찬(042-860-0812)

E-mail : echanzug@etri.re.kr

매수 : 보도자료 3매 (참고자료 x3매, 사진자료 x5매)

배포처 : ETRI 홍보실

ETRI, AI 영상압축 대회서 세계 1위 성과

- CLIC 2020 대회 저비트율 영상압축 분야 2팀 참가 성과해 입상

- AI기반 영상압축 및 화질개선, 차세대 비디오압축 원천기술 확보

국내 연구진이 인공지능(AI)을 이용해 영상을 압축하는 기술력을 겨루는 국제경진대회에서 우수한 성적으로 수상했다. 이로써 기존 MPEG, HEVC 등 국제표준 압축 기술에 이어 진화하는 미디어 콘텐츠를 효율적으로 이용할 수 있는 획기적 인프라 기술 개선에 큰 도움이 될 전망이다.

한국전자통신연구원(ETRI)은 세계적인 컴퓨터비전 관련 학회인 CVPR 미국 시애틀에서 14일, 온라인으로 개최한 인공지능 기반 영상 압축 기술 경진 대회(CLIC)에 두 팀이 참가해 각각 세계 1위와 2위 성적을 거뒀다고 밝혔다.

이로써 연구진은 몰입감과 현장감을 극대화할 수 있는 초실감 미디어 서비스 활용과 차세대 비디오 압축 국제표준화 선도를 위한 원천기술을 확보케 되었다.

올해로 3회째를 맞이하는 CLIC 대회는 구글, 페이스북, 넷플릭스 등 세계 유수의 기관들이 주관하고 후원하는 인공지능 기반 영상 압축 기술 관련 유일한 대회다.

최근 들어 VR, AR, 홀로그램 등 미디어 콘텐츠의 용량이 커지고 복잡해지고 있다. 이에 AI이용해 기존 방식의 한계를 뛰어넘어 압축률, 복원 영상 화질 등을 최적화하기 위한 산업 동향에 따라 대회의 중요성이 높아지는 추세다.

대회 심사 부문은 저비트율 영상 압축비디오 압축 두 개 분야다. ETRI저비트율 영상 압축 부문에 두 팀이 참가하여 전 세계 기업, 대학 연합팀들과 기술력을 겨뤘다.

ETRI가 참가한 저비트율 영상 압축 분야는 HD부터 4K 해상도의 다양한 자연 영상 428개를 화소당 0.15 비트율(bpp) 이하로 압축한 뒤, 다시 이를 복원한 결과물의 화질 수준을 경쟁하는 방식으로 이뤄진다. 원본 영상은 평균 24비트율을 지녀 기존보다 최대 1/160의 크기로 용량을 줄이면서도 화질을 떨어트리지 않는 것이 관건이다.

화질은 원본 영상을 압축한 뒤 복원한 영상의인지 화질을 기준으로 평가한다. 인지 화질은 거리와 밝기 등 정해진 프로토콜 환경 기준을 두고 사람이 직접 점수를 매겨 순위를 매기는 평가 방식이다.

ETRI에서 참가한 팀 중 하나는 기존 영상 압축 기술에 화질을 개선하기 위한 후처리 기술에 AI를 적용한 방식을 사용했고 다른 한 팀은 영상 압축 전 과정에 처음부터 AI를 도입한 방식으로 출전했다.

경진대회에 출전한 ETRI 이주영 선임연구원은지난해 발표한엔트로피 최소화 기반 영상 압축기술 등 원천 기술을 바탕으로 자체 기술력을 보유했다는 점에서 기존 공개된 여러 기술들을 조합해 나온 타 팀과는 차별화된다고 설명했다.

대회에는 총 55개 팀이 참가했으며 영상 화질 비교 평점 방법은 엘로 방식이 사용되었다. ETRI는 작년에 펼쳐진 CLIC 2019 경진대회에서도 복원 속도 부문에서 우승을 거머쥔 바 있어 2년 연속 입상하는 쾌거를 거뒀다.

ETRI는 이번 참가 팀이 모두 우수한 결과를 내면서 각 기술은 상호 보완을 이루며 차세대 영상 압축 기술 진보를 이룰 전망이라고 설명했다. 연구진은 해당 기술들을 차세대 비디오 부호화 국제표준 원천기술로 제정하기 위한 노력도 진행할 계획이다.

ETRI 김흥묵 미디어연구본부장은홀로그램, 라이트 필드, 포인트 클라우드 등 입체 영상의 시대가 도래하면서 기존 방식으로는 한계가 있던 분야에서 AI를 활용해 차세대 미디어 콘텐츠 확산을 이루는 기반 기술을 더 적극적으로 연구해 나가겠다고 말했다.

연구진은 향후 최신 비디오 부호화 표준인 HEVC 대비 4배 압축 성능과 화질 개선, 속도를 높이는 연구를 지속해나가면서 관련 분야 기술 우위를 점하기 위해 노력할 예정이다.

이번 성과는 과학기술정보통신부와 정보통신기획평가원(IITP)의 지원으로 이뤄진 초실감 테라미디어를 위한 AV부호화 및 LF미디어 원천기술 개발 과제의 일환으로 개발되었다.

ETRI는 본 기술과 관련하여 국내·외 특허 38건을 출원하였으며 인공지능 분야 Top-3 학회인 ICLR2019를 비롯해 국제논문 18건을 발표했다.

한편 ETRI는 지난 2018년 세계최대 영상보안학회(AVSS)주관, 스마트 교통관제용 차량 인식 기술이 국제대회에 참가해 세계 1위를 차지했다. 아울러 2017년에는 국제영상인식대회(ILSVRC, 이미지넷) 사물검출 분야에서 사물 종류별 검출 성능 기준 세계 2위와 평균 검출 정확도 기준 세계 3위 성적을 달성한 바 있다. <보도자료 본문 끝>

참고1

ETRI 기술 개념도

1) EIC-PQE 개념도

2) EIC-E2E-P 개념도

참고2

ETRI 출전 팀별 상세 기술 소개

ETRI에서 출전한 2개팀 중 하나인EIC-PQE팀은 기존 압축 코덱 (VVC)ETRI 인지화질 개선 인공신경망을 결합한 기술을 활용했다. 즉, 원영상을 VVC압축한 뒤, ETRIEIC-PQE 신경망에 입력해 화질을 개선하도록 설계되었다.

한편 기존의 인지화질 개선 인공신경망은 두가지 접근 방식으로 설계된다. 한 가지는 부호화 열화를 제거하는데 주력하는 방식으로 이러한 방식은 결과 영상을 뿌옇게 만드는 단점을 지닌다. 다른 방식은 부호화 처리로 인해 질감이 없어지는 텍스쳐 영역(나무가지 혹은 물결 등)을 복원하는데 주력하는 방식이다. 이러한 방식의 단점은 평평한 영역에 원치않는 노이즈가 발생한다.

연구진은 ETRI가 2019년도에 개발한 HGRDN을 활용하였다. ETRI 인지화질 개선 인공신경망의 특징은 부호화 열화 제거와 텍스쳐 복원을 동시에 하도록 설계하여 우수한 인지화질의 결과 영상을 얻을 수 있었다.

다른 한 팀인EIC-E2E-P팀은 움직임 보상 및 변환부호화 방식 기반 비디오 부호화 전 과정을 종단간(end-to-end) 신경망을 이용하여 영상을 압축 복원하는 기술을 활용했다. 이 기술은 신경망을 통해 생성되는 은닉벡터의 분포 근사모델을 정확히 추정함으로써 압축률을 높일 수 있다.

특히 ETRI는 문맥(Context) 적응적인 분포 모델을 이용하여 압축 효율을 획기적으로 높이는 기술을 보유하고 있다. 본 기술은 지난‘19년 5월 인공지능 분야 Top 학술대회인 ICLR2019의 메인 세션에서 발표한 바 있다.

이후 지속적인 기술개발 및 성능향상을 통해 현재 세계 최고 성능의 종단간 신경망 기반 영상 압축 기술을 보유하고 있다. 본 대회에서도 기존의 보유 기술을 기반으로 인지화질 측면의 성능을 개선하는 학습 기법을 적용하여 좋은 성적을 거두었다.

참고3

참가 기술별 성적

순위

입상기관팀 및 출품명 및 기술명

MOS Elo 획득점수

1위

ETRI 기술 1

(EIC-PQE)

xx.xx2258

2위

ETRI 기술 2

(EIC-E2E-P)

xx.xx2177

3위

NEURO

xx.xx1972