sub contents

ETRI

MENU  

VOL. 187 November 2021

TOP
Focus on ICT

인공지능을 위한
NPU Board 기술

지금 우리 삶 속에는 다양한 인공지능이 활약하고 있다.
매일 가지고 다니는 휴대폰에는 인공지능 비서가 우리를 기다리고,
도로 위에는 인공지능을 사용한 자율주행차가 다닌다.
최근에는 인공지능이 투자·금융 분야에서도 사용되고 있으며, 앞으로 그 분야는 더 넓어질 전망이다.

고성능 인공지능의 조건condition

인공지능은 얼굴인식이나 음성인식 등을 이용한 광고 등 비교적 간단한 일에서부터 의료 서비스나 주식시장 예측 등 복잡하고 중요한 일까지 처리하고 있다. 이렇게 다양한 분야 중에서도 의료나 금융 서비스 등 정확한 판단과 처리가 필요한 분야에는 초고성능 인공지능이 필요하다.

그렇다면 인공지능의 성능을 끌어올리려면 어떤 조건이 필요할까? 현재 인공지능 기술의 수준을 결정하는 것은 얼마나 많은 양의 데이터를 얼마나 빠르게 학습시킬 수 있는지다. 인공지능이 더 많은 데이터를 학습할수록, 데이터를 더 정확하게 처리하고 판단할 수 있다. 이에 따라 중요해지고 있는 것이 바로 인공지능을 구동할 하드웨어, 그중에서도 중앙처리장치(CPU)와 그래픽처리장치(GPU)등 시스템 반도체다.

CPU와 GPU, 그리고 NPU
deep learning

현재 대부분의 인공지능에는 병렬연산에 효율적인 GPU를 사용한다. 직렬연산은 하나의 복잡한 계산을 빠르게 처리할 수 있다면, 병렬연산은 다수의 계산을 동시에, 천천히 처리하는 방식이다. 많은 양의 데이터를 처리해야 하는 인공지능 학습에는 직렬연산보다는 병렬연산이 효율적인 것이다.

그러나 인공지능이 갈수록 복잡해지고, 학습하고 처리해야 할 데이터의 양도 기하급수적으로 많아지면서 여기에 사용되는 GPU의 가격도 높아졌다. 인공지능 연산에 사용되는 GPU는 1개의 가격이 최대 수천만 원에 이르며, 이마저도 하루가 다르게 복잡해지는 인공지능 연산에는 부족한 경우가 많다. 이런 경우 여러 개의 GPU를 연결하여 사용하게 되는데, 이마저도 수천 개의 GPU가 필요하고 큰 전력을 소모해 큰 비용이 드는 경우가 대다수다.

이에 따라서 인공지능 알고리즘을 더 효율적으로 구동할 수 있는 인공지능 전용반도체, NPU(신경망처리장치)의 연구와 개발에 뛰어드는 곳이 점차 많아지고 있다. NPU는 인간의 뇌를 모방해 설계된 장치로, 현재 인공지능 기술의 핵심인 딥러닝 알고리즘 연산에 특화됐다.

오직 인공지능을 위해 만들어진
반도체 NPUintelligent memory

인공지능 반도체는 그 설계부터 인공지능 알고리즘 최적화를 목표로 만든다. CPU나 GPU 등 전통적인 시스템반도체가 그래픽 작업이나 범용 연산을 위해 만들어진 것과 달리, NPU는 애초에 인공지능 알고리즘을 염두하고 만들어진 것이다.

현재 인공지능 반도체 설계에 가장 널리 사용되는 방법은 인공지능 알고리즘의 연산 과정을 하드웨어적으로 구현하는 것이다. 기본적으로 반도체가 데이터를 처리하기 위해서는 데이터를 저장하는 메모리반도체에서 연산을 처리하는 시스템반도체로 데이터를 이동시켜 연산을 처리해야 한다. 이같은 방식에서 연산 처리를 위해 데이터를 불러오는 과정을 없애고 하나의 칩에서 데이터 저장과 연산을 처리할 수 있도록 개발되고 있는 것이 지능형메모리반도체(PIM, Processor in Memory)다.

지능형메모리반도체, 즉 PIM이 주목받는 이유는 ‘폰 노이만 구조’의 한계를 극복할 수 있는 구조이기 때문이다. 미국의 수학자이자 물리학자인 폰 노이만이 1945년 처음 제시한 폰 노이만 구조에서는 명령을 입력하고 이를 CPU가 처리하는 과정에서 명령을 담은 프로그램과 데이터를 읽고 쓰는 활동이 모두 메모리에 기반을 두고 이뤄진다.

폰 노이만 구조는 현대 컴퓨터 대부분에 적용되어 있지만, ‘폰 노이만 병목’이라는 한계점이 있다. 프로그램과 데이터가 저장되는 메모리가 연산 장치와 구분되어 있다보니 연산을 처리하는 시스템반도체의 성능이 아무리 좋아지더라도 메모리에서 데이터를 불러오는 속도가 이를 따라가지 못하면 시스템 전체의 성능이 떨어지게 된다.

이에 반해 PIM은 하나의 칩 안에 데이터를 저장하는 회로와 연산하는 회로를 모두 집적하는 구조로 설계한다. 이렇게 설계된 PIM은 메모리반도체에서 시스템반도체로 데이터를 불러오는 과정이 크게 단축되거나 아예 사라진다. 연산 효율을 높이는 것은 물론 데이터 전송에 필요한 전력도 크게 줄일 수 있는 것이다.

인공지능 NPU Board 기술NPU Board

ETRI에서는 인공지능서버시스템에서 지능정보 처리에 적합한 인공지능 NPU 보드를 설계할 수 있는 ‘인공지능 NPU Board 기술’을 개발했다. 딥러닝을 반도체에 집적하여 최소화하려는 시장이 확대되고, Intell이나 Apple, Google 등의 글로벌 기업들이 자체적으로 딥뉴럴넷 컴퓨팅 전용 프로세서를 개발하고 있는 지금, ETRI의 기술이 기술종속성을 해결하고 글로벌 시장에서 활약할 수 있는 기회를 만들어낸 것이다.

인공지능 NPU 기술은 자율주행차 프로세서, 소형 로봇의 비전컴퓨팅 등 다양한 분야에 포괄적으로 사용할 수 있는 NPU 시스템을 설계할 수 있다. 시간이 갈수록 더 다양한 분야에서 더 많은 인공지능 기술이 사용될 미래, ETRI의 기술이 국내 인공지능 기술을 혁신하는 미래를 기대해본다.

본 내용은 ETRI 기술사업화플랫폼에 등재된
‘인공지능 NPU Board 기술’을 인용해 구성하였습니다.
저자 : 지능형반도체연구본부 권영수 연구원

자세한 문의 바로가기
  • 페이스북 공유하기
  • 네이버 공유하기
  • 카카오톡 공유하기