인류가 만들었지만 인류의 지능을 뛰어넘는 기술이 등장했다. 바로 인공지능(AI)이다.
단순 반복의 작업부터, 인간의 고유 영역이라고 생각됐던 예술 분야까지 섭렵한 AI.
그렇다면 AI는 어떻게 학습하는 것일까?
AI는 ‘컴퓨터로 구현한 지능 또는 이와 관련한 전산학의 연구 분야(TTA 정보통신 용어사전)’로, 인간의 인지능력(언어·음성·시각·감성 등) 학습 능력, 추론 능력 등 인간 지능을 구현하는 기술 분야를 말한다. AI란 용어 자체는 1956년 스탠퍼드대학의 존 매카시 교수가 미국 다트머스 대학에서 열린 워크숍에서 처음으로 사용하기 시작했다.
현재 AI 기술은 데이터 학습을 통해 인간 수준 이상으로 작업을 수행하는 기술에 사용되고 있다. 많은 양의 데이터를 학습한 기계는 주변 상황을 능동적으로 파악하고 대응할 수 있는 능력을 갖춘다. 그렇다면 AI는 어떤 방식으로 데이터를 학습하는 것일까?
AI는 인간의 학습 능력을 컴퓨터로 구현한 머신러닝 기술을 통해 학습한다. 머신러닝은 컴퓨터가 데이터를 분석하고, 분석을 통해 학습하고, 학습한 내용을 기반으로 판단, 예측을 할 수 있도록 알고리즘과 기술을 개발하는 기술 분야이다. 머신러닝 기술은 ‘지도학습’, ‘비지도학습’, ‘강화학습’ 이렇게 세 가지 분야로 나눌 수 있다.
지도학습은 알고리즘을 학습시킬 때 ‘정답이 있는 데이터’를 제공해 학습시키는 방법이다. 예를 들어 고양이와 강아지를 구별하도록 학습시킨다고 가정해 보자. 고양이와 강아지 사진을 수집한 뒤, 고양이 사진은 첫 번째 폴더에, 강아지 사진은 두 번째 폴더에 저장한다. 그리고 각 폴더에 어떤 동물이 있는지 정답을 알려준다. 이를 바탕으로 학습한 알고리즘은 이후 새로운 고양이, 강아지 사진을 제시했을 때 학습한 내용을 바탕으로 분류할 수 있게 된다. 지도학습의 심화 버전이 바로 딥러닝 기술이다.
비지도학습은 지도학습과 반대되는 개념이다. ‘정답이 없는 데이터’를 제공해 학습시키는 방법이다. 이 경우 고양이와 강아지의 사진만 제공하고 정답은 따로 주지 않는다. 사진을 학습한 알고리즘은 눈, 귀, 꼬리 등의 단서를 통해 스스로 고양이와 강아지를 분류한다. 이를 군집(Clustering)이라고 한다.
강화학습은 지도학습, 비지도학습과는 다른 학습 방식이다. 강화학습은 주어진 환경에서 특정 행동을 수행하고, 그에 대한 보상을 받는 시뮬레이션 형태로 학습된다. 데이터 없이 시행착오를 거쳐 학습하는 특징이 있다. 대표적인 예로 알파고가 있다. 바둑 대전을 스스로 진행하면서 수많은 경우의 수 가운데에서 승리하는 방법을 찾는다. 승리할 때마다 보상받게 되고, 이 보상을 받는 확률을 높이는 것이 강화학습의 핵심이라고 할 수 있다.
SNS상에서는 이미 AI를 활용한 작업물들이 쏟아져 나오고 있다. 그림을 그리고 글을 쓰는 것은 기본이다. 다양한 컨셉의 증명사진은 물론이고, 기존 가수의 목소리를 학습한 AI가 커버 곡을 부르기도 한다. 한 예능 프로그램에서는 ChatGPT로 가사를 짓고, 외출 의상을 추천받는 가수가 출연해 화제가 됐다. 차세대 AI라 불리는 ‘초거대 AI’가 삶 속에 스며들고 있다.
초거대 AI는 스스로 학습한 알고리즘을 통해 텍스트·이미지·영상 등을 이용자가 원하는 형태로 만들어 주는 AI 기술이다. 기존 AI보다 수백 배 이상의 데이터를 학습할 수 있기에 인간과 흡사하게 학습할 수 있고, 판단할 수 있다.
현재 오픈AI의 GPT-4, 구글의 PaLM 2, 네이버의 하이퍼클로바X(HyperCLOVAX), LG의 엑사원(EXAONE), 뤼튼테크놀로지스의 뤼튼2.0(wrtn 2.0) 등 다양한 초거대 AI 기술을 만나볼 수 있다. 각종 초거대 AI 기술들은 관공서의 상담 민원 서비스, 교통안전 GPT 서비스부터 디지털 난임 케어 서비스 등 다양한 분야에 접목되고 있다. 인류의 지능을 뛰어넘은 AI, 앞으로 어떤 미래를 만들어갈지 기대해 본다.