[ETRI 보도자료] ETRI, 노코드 기계학습 관리개발도구 공개한다_F.hwp
Embargo |
신문 : 11.3.(월) 조간용 온라인 : 11.2.(일) 12시 |
|||||
배포일자 : 2025.10.31.(화) |
배포번호 : 2025-79호 |
|||||
문의 |
인공지능컴퓨팅연구소 |
온디바이스AI연구본부장 |
정영준(042-860-6397) |
E-mail : jjing@etri.re.kr |
||
온디바이스AI모델연구실 |
책임연구원 |
조창식(042-860-5942) |
E-mail : cscho@etri.re.kr |
|||
대외협력본부 |
홍보실장 |
정길호(042-860-0670) |
E-mail : khchong@etri.re.kr |
|||
홍보실 |
선임행정원 |
김민규(042-860-0681) |
E-mail : kakapow@etri.re.kr |
|||
매수 : 보도자료 4매(참고자료 13매, 사진자료 00매) |
배포처 : ETRI 홍보실 |
|||||
ETRI, 노코드 기계학습 개발도구 모두 공개
- AI·SW지식 부족해도 한번 실행 OK, SW 손쉽게 개발도와
- 비전 MLOps 도구에서 생성형AI LLMOps 도구로 진화
- 6일 과총서 세미나, 노코드 신경망 개발 프레임워크 공개
국내 연구진이 지난 2021년부터 4년째 공장, 의료, 조선 등 산업 분야에서 비교적 인공지능 전문지식이 부족한 사용자들에게 손쉬운 SW개발 프레임워크를 제공, 큰 힘이 되고 있다.
한국전자통신연구원(ETRI)은 노코드 기반으로 신경망을 자동생성하고 배포 과정까지 자동화하는 기계학습 개발도구(MLOps)의 핵심기술을 오픈소스로 깃허브에 공개했다고 밝혔다.
연구진은 개발한 프레임워크인 탱고(TANGO)를 오는 6일, 서울 강남구 과학기술회관에서 깃허브 커뮤니티 확산을 위한 제4회 공개 세미나를 개최한다고 밝혔다.
탱고 프레임워크란 인공지능이 적용된 응용SW를 자동으로 개발하고, 클라우드, 쿠버네티스 온프레미스 환경, 온디바이스 등 다양한 디바이스 HW 환경에 맞게 최적화해 배포해주는 기술이다.
예컨대 철강공장에서 품질검사시 철강 데이터의 불량여부 판단은 쉽게 하나, AI의 적용이 쉽지 않았다. 병원의 의사 또한 폐결핵 X-레이 사진만 봐도 손쉽게 병명 판정은 쉬우나 AI로 자동예측하는 모델의 활용은 어려운 게 사실이었다.
ETRI가 만든 탱고 프레임워크는 이처럼 관련분야 전문지식은 있지만 데이터만 입력하면 자동으로 실행해주는 신경망 처리분야에 적합하다. 이용도 쉬워 깃허브에 있는 설치방법을 통해 간단한 명령으로 자동설치되며, 웹 접속을 통해 바로 실행된다.
기존 인공지능 응용SW 개발 방식에서 데이터 라벨링은 도메인 전문가가 담당하고, 인공지능 모델 개발·학습 및 응용SW의 설치·실행은 SW개발자가 직접 하는 구조였다.
그러나, 인공지능 기술의 확산과 함께 전 산업에서 SW에 대한 수요가 높아지고 있는 반면, 이러한 수요를 충족시킬 인공지능·SW 전문가는 부족한 상황이다.
이러한 문제를 개선하고자 ETRI는 이와 같은 국내 산업 현장의 수요를 반영, 객체 인식에 최적화된 신경망 자동화 개발 알고리즘을 개발 완료하고 이를 최종 공개했다. 또한, ETRI는 생성형AI 개발을 지원하는 LLMOps 도구도 함께 공개했다.
탱고 개발 과정에서 24개의 국내외 특허, NeurIPS 논문 3편 발표 및 SCI 논문 13편, 기술이전 4건 및 100억원 사업화 매출을 달성했다.
자율항해솔루션기업인 에이브노틱스는 탱고 기술이전을 통해 출연연의 우수 연구성과를 사업화하는 과학기술정보통신부의“공공연구성과 확산 및 실용화사업”에 선정되었으며, 한국과학기술지주(5억원), 신용보증기금(5억원), 로우파트너스(3억원)로부터 13억원의(기업가치 98억원) 투자를 받았다.
에이브노틱스는 기술이전을 통하여 탱고 온디바이스 배포 기술, AI 성능 최적화 기술을 확보하고, 항해사에게 필요한 맥락적 상황 정보를 자동으로 생성하는 온디바이스AI에 대해 사업화 중이다.
연구진은 핵심기술 개발 완료에 이어, 공동연구기관을 중심으로 실증을 통해 보급확산에 주력하고 있다.
공동연구기관인 ㈜웨다에서는 철강과 자동차 부품 제조 업체 2개 기업을 대상으로 현장 직원들이 활용 가능한 인공지능 서비스를 구축했다. 특히 자동차 범퍼롤과 같이 기존보다 더 복잡한 형상의 비전 외관검사에 인공지능서 비스를 구축했다.
공동연구기관 래블업(주)는 KT클라우드와 협업으로 리벨리온사의 최신 국산 AI 가속기인 아톰맥스를 지원하는 배포탑재 서비스를 출시하였으며, KT와 협력해 GPU 클라우드 대여서비스를 상용화하였다.
서울대병원은 대규모의 흉부 CT 영상과 판독문 데이터를 활용해, CT 영상으로부터 자동으로 질환 판독문을 생성하는 인공지능 기술을 개발하고 있다. 개발된 기술은 서울대병원을 포함한 4개 병원(서울대병원, 서울대분당병원, 서울대병원강남센터, 보라매병원)에서 심폐혈관 질환 예측 서비스를 실증하며, 실제 임상 데이터를 통해 평가·검증될 예정이다.
특히 생성형AI 개발을 지원하는 LLMOps 도구는 ㈜아크릴과의 협업을 통하여 바로 사업화 가능하도록 진행중이다. 아크릴의 상용제품인 조나단(Jonathan) 소스 코드가 깃허브에 모두 공개하고 있으며, 핵심 알고리즘을 추가하고 산업 특화 생성형AI 적용을 위한 표준 운영 환경 구축을 동시에 진행하고 있다.
정보통신기획평가원(IITP) 김태호 SW PM은“탱고(TANGO) 기술은 명실공히 대한민국 최고의 공개SW 과제로써 인공지능 개발도구 분야에서 국내 SW산업 경쟁력 제고에 큰 도움이 되고 있다”라고 밝혔다.
ETRI 조창식 책임연구원은“기존 비전 신경망을 활용한 탱고 프로젝트를 확장하여 생성형AI를 지원하는 LLMOps 도구 분야로 깃허브 프로젝트를 확장해 나갈 예정이다. 향후에도 개발 과정의 모든 노하우를 공개하고, 실증을 통해 산업체에서 바로 사업화 가능한 솔루션으로 제공하겠다.”고 말했다.
연구진은 앞으로도 매년 반기별로 새로운 버전의 소스코드를 깃허브로 공개할 것이라고 밝혔다. 연 1회 하반기에는 공개 세미나를 개최, 기술개발 소스코드 뿐만 아니라 실증 노하우 등도 함께 공유할 계획이다. 한편, 3차 탱고 공개 세미나까지 347개 기관에서 631명이 참석하여 인공지능 기술에 대하여 교류하였다.
본 성과는 과학기술정보통신부와 정보통신기획평가원의“신경망 응용 자동생성 및 실행환경 최적화”과제 및 “생성형AI 지원 시스템SW 프레임워크”과제 지원을 받아 개발되었다. <보도자료 본문 끝>
용어설명 |
1) 노코드 : 코딩 경험이 부족한 사람을 위해 사용자 친화적인 인터페이스로 보다 빠르고 정확하게 응용개발이 가능토록 돕는 개발방식
2) 기계학습 개발도구(MLOps) : MLOps는 Machine Learning Operations의 약자로, 데이터 전처리, 모델 개발, 배포, 운영 등을 포함한 기계학습의 라이프 사이클을 관리하는 기술 및 도구
3) 깃허브 주소 :
4) 탱고(TANGO) : TANGO (Target Aware No-code neural network Generation and Operation framework)
5) 쿠버네티스 온프레미스 환경 : 공장, 병원 등에서 보안상의 이유로 클라우드 환경 대신 자체 서버나 데이터센터를 운영하는 환경을 의미함. 즉 외부 서비스 제공업체의 인프라를 사용하지 않고, 자체 물리적인 인프라(서버, 네트워크 등)에서 쿠버네티스를 배포하고 관리하는 것을 의미. 쿠버네티스(Kubernetes)는 컨테이너화된 애플리케이션을 배포하고 관리하는 오픈 소스 시스템임
6) 데이터 라벨링 : 기계학습(Machine Learning) 또는 인공지능(AI) 모델을 훈련시키기 위해 데이터를 식별하고 주석을 추가하는 과정으로, 학습 모델이 데이터를 이해하고 예측할 수 있도록 도와줌. 예를 들어, 이미지 인식 모델을 훈련시키기 위해 사진에 담긴 객체(예: 고양이, 개, 자동차 등)에 대한 설명(라벨)을 추가
7) 생성형AI 개발도구(LLMOps) : LLMOps는 LLM Operations의 약자로, 데이터 준비, 학습, 튜닝, 배포, 운영 등을 포함한 대형 언어 모델(LLM) 학습의 라이프 사이클을 관리하는 기술 및 도구
참고1 |
노코드(No-Code) R&D 과제 공개 행사 |
□ 행사 개요
○ (목적) 기존 산업에서도 인공지능 응용SW를 손쉽게 개발할 수 있도록 지원하는 SW R&D 과제의 핵심 알고리즘 공개 및 홍보
- 금번 4회 행사로, 이후로도 반기별로 새로운 버전의 소스코드를 공개하고, 연 1회(하반기) 공개 세미나 개최 예정
< 참고 : 과제 개요 > ○ (과제명) 신경망 응용 자동생성 및 실행환경 최적화 배포를 지원하는 통합 개발 프레임워크 기술 개발 ① 신경망 응용 자동생성 : 인공지능 기술이 적용된 응용SW를 자동으로 개발 ② 실행환경 최적화 배포 : 다양한 산업환경(클라우드, 쿠버네티스 엣지 환경, 온디바이스)에서 개발된 응용SW를 설치, 실행할 수 있도록 지원 의료·스마트 공장 등 대상 산업에서 실제 활용할 수 있도록 데이터 라벨링~AI 모델 생성~AI 학습~응용SW 개발~다양한 환경에 최적화까지 자동화하여 통합적으로 개발하는 노코드 기반 MLOps 프레임워크 ○ (예산/기간) 총 사업비 국고 117.08억원 / ‘21.4월~‘25년.12월 ○ (주관/참여) ETRI / (공동연구개발) 래블업, 웨다, 서울대학교병원, 한국인공지능협회 / (위탁연구개발기관) 고려대산학협력단, 홍익대산학협력단, 중앙대산학협력단 ○ (기대효과) AI·SW 지식이 부족한 타 산업에서도 필요한 AI 기반 SW를 손쉽게 개발할 수 있도록 함으로써 AI·SW 기술의 전 산업 확산·디지털 혁신 촉진 |
○ (행사명) 인공지능 기술의 대중화를 위한 TANGO 커뮤니티 4회 컨퍼런스
※ TANGO(Target Aware No-code neural network Generation and Operation framework)는 본 과제의 개발·확산을 지원하기 위한 오픈소스 커뮤니티의 명칭
○ (일시/장소) 12.6(목) 13:30~17:45 / 서울 과학기술회관 대회의실2
○ (주관/후원) ETRI / 래블업, 웨다, 테슬라시스템(국내SW기업), 한국인공지능협회, 서울대병원, 고려대학교, 홍익대학교, 중앙대학교, 알티스트, KETI, 에이브노틱스, 슈어데이타랩, 아크릴, TTA
○ (주요내용) 본 과제를 운영하는 오픈소스 커뮤니티 및 현재까지 개발된 핵심 기술 소개를 통한 외부 개발자·사용자 유인
□ 행사 계획
참고2 |
2024년 제3회 탱고 커뮤니티 컨퍼런스 행사 |
○ (행사명) 인공지능 기술의 대중화를 위한 TANGO 커뮤니티 3회 컨퍼런스
○ (일시/장소) 12.5(목) 13:30~17:45 / 서울 과학기술회관 대회의실2
○ (주관/후원) ETRI / 래블업, 웨다, 테슬라시스템(국내SW기업), 한국인공지능협회, 서울대병원, 고려대학교, 홍익대학교, 중앙대학교
○ (참석 현황) 157개 기관, 258명 참석, 사전등록자 총 476명
○ (행사 사진)
|
|
|
|
|
|
|
|
|
|
참고3 |
기존 기술과의 차이점 - ① MLOps 통합 파이프라인 제공 |
□ (MLOps 개념) MLOps는 기계학습의 전체 라이프사이클을 관리하며, 단순한 기계학습 모델뿐만 아니라 데이터 수집/분석부터 모델 학습/배포까지 전과정을 하나의 AI 라이프사이클로 보고 통합 개발을 지원함
※ ML(Machine Learning, 기계학습) 시스템에 DevOps를 적용한 개념
○ 기존 기술의 문제점
- (기존 수동 머신러닝) 데이터 준비~데이터 라벨링~AI모델 개발~AI학습~AI기반 응용SW개발~설치·실행까지 SW개발자가 직접 개발
- (기존 자동 머신러닝) 구글, 아마존, MS 등 외산 클라우드 업체들은 MLOps 도구를 지원하나, 자사의 클라우드 시스템 배포를 가정하고 도구를 제공
※ 신경망 자동생성 현존 기술 수준은 이미지 분류(Classification)의 자동화 위주로 연구되고 있으나, 이는 실제 산업 현장에서 적용하기 어려움
※ 산업 현장은 단순히 단일 이미지가 어떤 항목에 해당하는지 분류하는 것을 넘어, 이미지 속의 여러 객체를 분류하고 위치를 표시하는 객체 검출(Object Detection) 필요(붙임 참조)
○ (본 과제 : 신경망 개발 통합 파이프라인 지원) TANGO는 데이터 준비~데이터 라벨링~AI모델 개발~AI학습~AI기반 응용SW개발~설치·실행까지 ML시스템 개발 전 과정을 지원
- 타겟 HW 인지형 신경망을 자동생성하고, 다양한 환경(클라우드·쿠버네티스 엣지·온디바이스)에 최적화된 배포까지 하나의 도구로 자동화
○ (본 과제 : 타겟 디바이스 인지형 신경망 자동생성) 배포 환경의 타겟 하드웨어 성능을 인지하여 가속환경과 추론엔진에 최적화된 신경망을 자동으로 생성하고 배포하는 전 과정을 지원
참고4 |
기존 기술과의 차이점 - ② 다양한 배포 환경 지원 |
□ 다양한 배포환경, 다양한 추론엔진 지원
○ 기존 기술의 문제점
- 구글, MS, 아마존 등 글로벌 기업에서 클라우드를 이용한 신경망 생성 도구를 지원하고 있으나, 자사의 클라우드 환경에 적합한 도구이며, 산업 현장에서 실제로 요구되는 다양한 종류의 타겟 하드웨어를 지원하기에는 어려움
- 클라우드 기업의 경우 자사의 클라우드 외 다양한 환경(엣지, 온디바이스)에 대한 배포 지원이 부족하며, HW 기업(NVIDIA 등)의 경우 자사 HW에서만 사용 가능한 도구만 지원
○ (본 과제 : 다양한 배포환경 지원) 클라우드 서버로부터 쿠버네티스 엣지 환경, PC 및 온디바이스에 이르는 다양한 배포환경 지원
참고5 |
데이터 라벨링 방식과 산업 현장 적용 |
참고6 |
LLMOps 설명 |
□ (LLMOps 개념) LLMOps는 생성형AI 개발을 위한 전체 라이프사이클을 관리하며, 단순한 학습 과정뿐만 아니라 LLM을 활용하는 전 과정(데이터 준비 → 학습 → 튜닝 → 배포 → 모니터링)을 자동화하고 최적화하여 통합 개발을 지원
※ LLM (Large Language Model, 대형 언어 모델) 시스템에 DevOps를 적용한 개념
□ 생성형 AI 개발도구 개념도
○ 기존에 배포된 범용의 파운데이션 모델(중국 딥시크, ChatGPT)을 도메인 특화 데이터를 가지고서 추가 학습을 하고, 경량화 과정을 거친 다음, 최종 타겟(클라욷, 엣지, 온디바이스)에 배포하게 됨
○ 데이터 증강 : 도메인 데이터가 부족하기 때문에, 증강 기법을 적용하여 학습에 필요한 추가 데이터를 생성하는 것이 필수적
○ 파인튜닝 : 이미 일반적인 언어 능력을 갖춘 모델(예: GPT, LLaMA 등)에 추가적인 데이터를 학습시켜, 특정 도메인(조선, 의료, 농업 등)이나 특정 작업(요약, 질의응답 등)에 특화되도록 만드는 방법
○ 지식증류 : 딥러닝에서 큰 모델(Teacher)의 지식을 작은 모델(Student)에 전달해서, 성능은 최대한 유지하면서 가볍게 만드는 기법임
○ 양자화 : 인공지능 특히 딥러닝 모델에서 모델의 크기와 연산 속도를 줄이기 위해 숫자의 정밀도를 낮추는 기법으로, 딥러닝 모델의 숫자 표현을 float32 → int8, float16 등 저정밀도로 바꾸는 최적화 기법임
○ 가지치기 : 딥러닝 모델에서 중요하지 않은 뉴런이나 가중치를 제거하여 모델을 더 작고 빠르게 만드는 최적화 기법임
□ 탱고 LLMOps 실행화면
<탱고 LLMOps 실행화면>
참고7 |
생성형 AI |
□ 생성형 AI
○ 인공지능 응용이 기존 단순 진단 서비스에서 미래상황을 예측하고, 인간의 개입 없이도 스스로 환경을 인식하고, 데이터를 분석하며, 학습을 통해 효율적으로 문제를 해결하는 식으로 진화
- 기존 단순 항해에서 벗어나, 항해북 (기존 사고 사례, 충돌 상황 예상시 항행규칙) 학습을 기반으로, 해상 상황을 인식하고 항행규칙을 기반으로 자율항해 수행
- 공장, 농업 등 기존 전문가, 장인, 명장 등의 암묵지를 학습하여, 해당 분야 초보자들도 쉽게 전문지식을 전수 가능함
- 기존 단순 진단 서비스에서 (즉 폐결핵 진단) 벗어나, 의료 영상으로부터 판독문을 자동으로 생성하고, 해당 질병에 대한 치료 방법을 제안하며, 치료경과를 예측하는 서비스로 진화
항목 |
기존 기술 |
발전 전망 |
서비스 |
단순 진단 서비스 (공장 불량품 진단, 차선/신호등 인식 등) |
예측 서비스 및 진단 결과에 대응하는 온디바이스 SW 프레임워크 서비스 |
데이터 |
단일 데이터 사용 - 이미지/동영상(비전) - 스트림 센서 데이터(IOT, 라이더, 레이더 등) - 언어 데이터 |
멀티모달 및 센서 퓨전 데이터 - 이미지/동영상, 스트림 센서 데이터, 언어 데이터, 오디오 데이터 퓨전 |
학습 방법 |
지도학습 (데이터 라벨링 및 학습) |
비지도학습(라벨링없이 파운데이션 모델을 파인튜닝) |
대표 알고리즘 |
YOLO |
LLM, 스테이블 디퓨전, 강화학습 |
학습 데이터 |
대량 (라벨링 품질이 학습의 품질을 결정) |
초대량 (라벨링으로 감당하기 어려운 수준의 데이터 양) |
연산 최적화 |
컨벌루션 연산 최적화 |
트랜스포머 연산 최적화 |
지속학습 |
학습/배포 일괄 서비스 제공, 재배포 없음 |
서비스 후에도 데이터를 계속적으로 수집하여 지속적 자동 학습/재배포 |
참고8 |
생성형 AI 응용 - 흉부 CT 영상 판독 |
□ 흉부 CT 영상 판독 및 심폐혈관 질환 진단 서비스
- 서울대병원 흉부 CT 데이터셋을 가지고 학습하여, 판독문을 자동생성하고심폐혈관 질환 진단 수행
- 서울대병원 4곳(서울대병원 본원, 서울대병원 분당서울대병원, 보라매서울대병원, 서울대병원 강남센터) 영상의학과 판독실에 서비스 설치
- 4개 병원 판독 결과 및 판독문 결과를 통합 분석하고, 병원 간 예측 정확도 및 판독문의 일관성을 비교, 분석
참고9 |
생성형 AI 응용 - 암묵지 학습을 통한 스마트팜 생육 제어 |
□ (목적) 소프트웨어를 핵심 동력으로 삼아 농업 시스템의 제어, 관리 및 최적화를 구현하는 미래형 농업 모델임
※ 암묵지 (tacit knowledge) : 경험과 학습을 통해 체화되었지만, 말이나 글로 표현하기 어려운 개인에게 축적된 지식
- '노하우'와 비슷한 개념으로 사용
- 반대 개념은 책이나 문서처럼 명확하게 표현되어 공유하기 쉬운 형식지(explicit knowledge)
○ 핵심 요소
- 다양한 센서와 제어기를 통해 수집되는 작물 재배 환경 및 농업 마이스터의 제어(암묵지) 데이터
- 수집된 데이터와 농업 전문 기관의 가이드를 기반으로 하는 생성형AI 모델
- 생성형AI 모델을 기반으로 챗봇 및 자동 제어를 위한 액션 에이전트
○ 농업 마이스터가 가진 암묵지처럼 조언하고 자동 정밀 제어를 수행
- 원격/자동 제어 기술을 통해 농업인의 노동 부담과 강도를 획기적으로 줄이고, 고령농 지원 및 농촌 인력난 해소
- 데이터 기반 정밀 농업을 통해 작물 생육을 최적화하여 균질하고 고품질의 농산물을 안정적으로 생산
- 첨단 기술의 접목으로 농업을 고부가가치 산업으로 전환하여, 청년층의 유입을 촉진