HWP문서[ETRI 보도자료] ETRI 오디오기술, MPEG 국제표준에 반영_F.hwp

닫기

Embargo

없음

배포일자 : 2025.08.06.(수)

배포번호 : 2025-59호

초실감메타버스연구소

미디어연구본부장

이태진(042-860-5713)

E-mail : tjlee@etri.re.kr

미디어연구본부

미디어부호화연구실장

강정원(042-860-5137)

E-mail : jungwon@etri.re.kr

미디어부호화연구실

책임연구원

유재현(042-860-1556)

E-mail : jh0079@etri.re.kr

대외협력본부

홍보실장

정길호(042-860-0670)

E-mail : khchong@etri.re.kr

홍보실

선임행정원

김민규(042-860-0681)

E-mail : kakapow@etri.re.kr

매수 : 보도자료 3매(참고자료 41매, 사진자료 105매, 영상자료 3매)

배포처 : ETRI 홍보실

ETRI 오디오 기술, MPEG 국제표준에 반영

- 음원위치 지연기술, 몰입형 오디오 국제표준 최종안 포함

- 현장감 있는 3D 오디오 구현, 사실적 사운드 기술력 입증

- 메타버스, VR 오디오 진화 기대...청각경험을 가상환경 확장

국내 연구진이 독자적으로 개발한 실감형 오디오 기술이 디지털 비디오 및 오디오 압축 표준을 개발하는 국제 표준화 기구에서 괄목할만한 성과를 거두었다.

한국전자통신연구원(ETRI)은 연구진이 개발한음원 위치 지연 기술이 국제표준화기구인 MPEG의 몰입형 오디오 국제표준인 MPEG-I immersive audio 표준 최종안에 지난 4월 공식 반영됐다고 밝혔다.

이와 같은 성과는 사실상 해당 오디오 관련 핵심기술이 국제표준으로 채택되었음을 의미하는 것으로, 실감형 오디오 분야에서 국내 연구진이 국제표준을 선도하는 중요한 이정표가 될 것으로 평가된다.

ETRI 연구진은 표준문서 작성은 물론, SW개발에 직접 참여했다. 해당 신호처리를 위한 별도의 항목도 만들어 국제표준으로 견인 중이다. 연구진은 아울러, 음원의 거리에 따른 지연위치 보상방법 및 장치 등 총 12건의 국제표준특허가 채택되었다고 밝혔다.

ETRI가 개발한음원 위치 지연 기술은 전투기처럼 빠르게 이동하거나 천둥과 번개처럼 먼 거리에서 발생한 소리가 실제로 보이는 위치보다 약간 지연되어 들리는 현상을 실제와 같이 정밀하게 구현하는 기술이다.

현실 세계에서는 소리의 발생 시점과 청취 시점간 시간차, 즉 청각적 시간차가 자연스럽게 인지되지만, 기존의 가상 오디오 기술에서는 청각적 시간 지연 요소가 반영되지 않아 현실감 및 몰입감이 떨어지는 실제 물리현상과 다른 한계가 있었다.

ETRI는 이 같은 기술적 한계를 극복하고, 가상환경에서도 시간 기반의 청각 지각 요소를 구현함으로써 더욱 자연스럽고 현실감 있는 3차원 오디오 경험을 제공할 수 있게 되었다. 즉 이번에 개발한 기술은 이처럼 청각의 시간차까지 잡아낸 세계 최초 기술인 셈이다.

MPEG-I 몰입형 오디오는 청취자의 자유로운 이동과 인터랙션이 가능한 6DoF 공간음향 서비스를 위한 몰입형 실감음향 렌더링 기술 및 렌더링에 필요한 메타데이터 부호화에 대한 표준화를 목표로 하는 MPEG 오디오 기술 표준화이다.

빠르게 이동하는 멀리 있는 음원에 대한 음원위치 지연효과를 보상하는 ETRI음원 위치 지연 기술은 이 표준에 시간 기반 청각 요소를 더해 몰입감을 획기적으로 향상시킬 수 있게 되었다. 이를 통하여 VR경험, 훈련, 교육 등과 같이 정밀한 현실 시뮬레이션이 요구되는 분야에 핵심적인 요소로 활용을 가능하게 했다.

이 기술은 향후 사용자 시점 변화에 따라 3차원 공간상 오디오가 실시간 반응하는 차세대 오디오 기술로서, 몰입형 가상현실(VR)은 물론, 메타버스, 가상회의, 원격교육, 게임, 실감 공연 등 다양한 산업에서 폭넓게 활용될 수 있어, 국내 실감미디어 기술의 국제적 위상 제고와 차세대 오디오 시장을 선도할 전망으로 보인다. 아울러 관련 산업의 경쟁력 강화에도 크게 기여할 것으로 보인다.

ETRI 미디어부호화연구실 강정원 실장은이번 성과는 단순한 기술 제안이 아닌, 국제표준 수립의 핵심 구성요소로 우리 기술이 인정받은 것으로 의미가 크다. 앞으로도 실감미디어 분야에서 세계를 선도할 수 있는 오디오 기술 확보와 국제표준화 활동에 지속적으로 주력하겠다고 말했다.

ETRI 이태진 미디어연구본부장도그동안 몰입형 오디오 표준은 주로 소리의 방향성과 거리 표현 등 공간적요소에 집중돼 있었으나, 실제 청각 인식에서 중요한 시간 기반 지각 요소는 표준화 논의에서 간과되어 왔다. 이번 기술 반영은 단순한 기능 추가가 아닌 국제표준 수립의 핵심 요소로 인정받은 성과이다라고 밝혔다.

ETRI는 이번 기술을 바탕으로, 초실감 입체공간 미디어 기술 선도를 위해 동적 입체공간 미디어 획득·생성 및 실시간 콘텐츠 상호작용 기술 개발 저지연·고품질 동시지원 음향 압축 및 국제표준화 등에 힘쓸 예정이다. 아울러 초실감 양방향 입체 통신의 구현을 위해서도 실시간 공간 콘텐츠 생성기술 공간 상호작용 핵심기술 개발 및 실증(PoC)에 매진할 계획이다.

본 연구는 한국전자통신연구원 연구운영비지원사업의 일환으로서초실감 입체공간 미디어·콘텐츠 원천기술연구과제로 수행되었다. <보도자료 본문 끝>

용어설명

1) 국제표준화기구 MPEG(Moving Picture Experts Group) : 디지털 비디오 및 오디오의 압축 표준을 개발하는 국제 표준화 기구로, 1988년에 설립되었으며, ISO/IEC JTC 1/SC 29라는 국제 표준화 위원회의 산하 작업 그룹

2) 몰입형 오디오 국제표준(MPEG-I Immersive Audio) : 청취자의 자유로운 이동과 인터랙션이 가능한 6DoF 공간음향 서비스를 위한 몰입형 실감음향 렌더링 기술 및 렌더링에 필요한 메타데이터 부호화에 대한 표준화를 목표로 하는 MPEG 오디오 기술 표준화

3) ‘음원 위치 지연 기술(Sound Source Location Delay Technology)’ : 빠르게 이동하거나 먼 거리에서 발생하는 음원이 시각적으로 보이는 위치보다 지연된 위치 혹은 시간에 들리는 현상을 사실적으로 정확하게 구현한 기술

4) 표준 최종 초안(FDIS, Final Draft International Standard) : MPEG 표준은 새로운 기술 제안인 NP(New Proposal)에서 시작하여, 내부 작업 초안인 WD(Working Draft), 회원국 검토를 위한 CD(Committee Draft), 국제 표준 초안인 DIS(Draft International Standard), 최종 승인 단계인 FDIS(Final Draft International Standard)를 거쳐, 최종적으로 IS(International Standard)로 제정됨

5) 바이노럴 신호처리 : 사람의 두 귀로 들리는 소리를 모방하여, 입체적이고 현실감 있는 3차원 음향을 생성하는 오디오 처리 기술

참고1

참음원위치 지연기술고자료

음원 위치 지연 기술(Sound Source Location Delay Technology)은 아래의 그림에서와 같이, 빠르게 이동하거나 먼 거리에서 발생하는 음원이 시각적으로 보이는 위치보다 지연된 위치 혹은 시간에 들리는 현상을 사실적으로 정확하게 구현한 기술이다. 그동안의 가상 환경 오디오 분야에서는 반영되지 않았던 기술로, 이를 통해 보다 사실적이고 현실성이 뛰어난 음향을 VR, 타버스, 원격교육, 가상 회의, 게임, 실감 공연 등에서도 제공할 수 있다.