시선뉴스=심재민 기자 / 디자인=김선희 pro | 전 세계를 대표하는 기업들의 화두 중 하나는 뭐니 뭐니 해도 ‘AI’ 기술이다. 그 중 지난 해 말 출시와 함께 큰 이목을 모았던 생성형 인공지능(AI) ‘챗GPT’. 이후 수많은 IT 공룡들이 대화형 AI 챗봇 개발에 열을 올렸고 다양한 서비스가 출시되고 있다. 그리고 이러한 대화형 AI 챗봇을 구현하기 위해 ‘거대언어모델(LLM)’ 기술이 활용되고 있다. 

거대언어모델(LLM)은 Large language model의 약자로, 국내에서는 대형언어모델, 대규모언어모델 등으로도 불리고 있다. 인공 신경망으로 구성되는 언어 모델로, 자기지도학습이나 반자기지도학습을 사용하여 레이블링되지 않은 상당한 양의 텍스트로 훈련되어 사용자에게 정보를 제공한다. 이 기술은 2018년 즈음에 나타난 것으로 알려졌으며, 다양한 작업을 위해 수행된다. 특히 거대언어모델은 챗GPT등 AI 챗봇 기술을 가능하게 하는 요소로, 최근 기업들은 물론 많은 이들에게 화제를 불러일으키고 있다. 

거대언어모델(LLM) 기술이 더욱 발달하면서 사람처럼 묻고 답하는 생성형 인공지능(AI) 챗GPT가 한층 사람에 가깝게 진화했다. 사람과 음성으로 대화하고 이미지를 보고 질문에 답할 수 있게 된 것. 이 중심에는 선두주자 오픈AI가 있다. 오픈AI는 지난 달 25일(현지시간) 챗GPT가 '보고 듣고 말하는' 새로운 기능을 조만간 제공하게 된다고 밝혔다. '듣고 말하는 기능'은 이용자와 음성으로 질문과 답변을 주고받는 기능이다. 지금까지는 프롬프트를 통해 대화했다면 이제는 음성 대화가 가능해진다.

오픈AI의 새로운 기술은 아마존의 AI 비서인 알렉사(Alexa)나 애플의 시리(Siri), 구글 어시스턴트(Google Assistant)와 비슷한 기능이다. 다만, 이들 AI 비서가 주로 이용자의 음성 명령을 실행하는 데 초점이 맞춰져 있는 것과 달리 챗GPT는 대화를 할 수 있다. 음성으로 질문을 하면 챗GPT가 이를 텍스트로 변환해 거대언어모델(LLM)에 전달하고, 답변을 받아 다시 음성으로 변환해 말하는 방식이다. 챗GPT 음성은 5가지 형태로 제공되며, 이용자는 이 중 하나를 선택할 수 있다.

오픈AI 외에 다양한 기업들도 고도화된 거대언어모델(LLM) 기술을 활용한 서비스를 선보이며 경쟁을 벌이고 있다. 대표적으로 아마존은 업그레이드된 음성 대화 '인공지능(AI) 비서' '알렉사'(Alexa)를 공개했다. 알렉사는 아마존이 2014년 처음 선보인 AI 플랫폼으로, 아마존의 에코(Echo) 스피커 등 제품에 탑재돼 AI 음성 비서 역할을 한다. 이날 공개된 알렉사는 새로워졌다. 새로운 대규모 언어 모델(LLM)을 기반으로 이용자와 묻고 답할 수 있는 생성형 기능이 탑재됐다. 챗GPT와 구글의 바드가 프롬프트 입력을 통해 대화할 수 있는 AI라면 알렉사는 음성으로 대화하는 '핸즈 프리'(hands-free) AI로, 거의 사람과 같은 상호작용을 할 수 있는 것으로 알려졌다. 

AI 경쟁을 둘러싼 경쟁이 치열해지고 있는 상황, 특히 그 중심에는 인간과 AI의 정교한 대화가 가능한 AI 챗봇 기술이 있다. 이를 가능하게 하는 거대언어모델(LLM) 기술의 발전에 따라 AI 기술과 인간과의 친밀감은 더욱 높아질 것으로 기대된다. 

SNS 기사보내기
관련기사