[카드뉴스] 어떻게 내 말을 알아듣지? 인공지능(AI) 스피커가 목소리를 알아듣는 이유

조재휘 기자 kkyaho13@sisunnews.co.kr 기자의 다른기사 보기

현재위치
입력 2022.02.08 10:58
댓글 0

가

이 기사를 공유합니다

[시선뉴스 조재휘 / 이미지 서치 임하은 수습] 현재 우리는 인공지능(AI) 스피커를 통해 말로만 전자기기를 작동하기도 하고 정보 수집까지 가능한 시대에 살고 있다. 많은 IT 기업이 이 분야에 뛰어들었으며 일반 가정이나 호텔 등 인공지능(AI) 스피커의 영역은 확장되고 있다. 목소리를 통해 기기가 작동하는 것이 신기하기도 하지만 어떤 원리인지 의문점이 생기기도 한다. 그렇다면 인공지능 스피커와 같은 기계들은 어떻게 사람 말을 알아들을 수 있는 걸까.

인공지능은 사고나 학습 등 인간이 가진 지적 능력을 컴퓨터를 통해 구현하는 기술로 개념적으로 강 인공지능(Strong AI)과 약 인공지능(Weak AI)으로 구분할 수 있다. 강 인공지능은 사람처럼 자유로운 사고가 가능한 자아를 지닌 인공지능으로 인간을 완벽하게 모방한 인공지능이다.

약 인공지능은 자의식이 없고 주로 특정 분야에 특화된 형태로 개발되어 유용한 도구로써 설계된 인공지능이다. 인공지능 바둑 프로그램인 알파고(AlphaGo)나 의료분야에 사용되는 왓슨(Watson) 등이 대표적이다.

인공지능 기술 중 음성 언어 처리 기술은 인간의 음성을 컴퓨터가 인식할 수 있는 문자 데이터로 변화하는 음성 인식 기술과 컴퓨터가 인식한 문자 데이터의 의미를 분석해 컴퓨터가 제대로 이해할 수 있도록 하는 자연어 처리 기술로 구성된다. 이 자연어 처리 기술이 인공지능 스피커와 대화를 가능하게 하는 핵심이다.

인공지능 스피커는 음성신호를 주파수 스펙트럼으로 변환하고 들어온 음성을 음소 단위로 분류해서 인식한다. 그리고 단어 사이의 관계를 확률적으로 계산해 사람이 이해할 수 있는 문장을 만들어 낸다.

소리를 글자로 만들어 인식하고 여기부터는 딥러닝 기술이 사용된다. 빅데이터에 기반한 딥러닝 기술로 방대한 양의 정보를 통해 결과 값을 생성하게 된다. 문맥에 적합한 문장으로 완성시켜 스피커를 통해 음성이 출력되고 서비스가 연동되는 것이다.

불과 10여년 전 까지만 해도 음성인식 시스템의 정확도는 70% 안팎으로 부족한 점이 많았지만 현재는 인식률을 높이기 위한 노력이 계속되고 있다. 멀리서도 사용자의 음성을 잘 인식해야 하는 과제가 있는 가운데 사투리도 알아듣는 기술, 주변의 소음을 제외하고 사용자의 음성을 정확하게 인식하는 기술 등을 개발 중이다.

현재는 AI 스피커뿐만 아니라 휴대전화 등 다양한 제품에서 음성인식 서비스가 활용되고 있다. 음악 재생, 길 찾기, 정보 검색 등 일상 곳곳에서 인공지능 스피커는 우리와 함께 하고 있는 중이다.

우리는 현재 사물과 사람이 대화하는 시대에 살고 있다. 말만 하면 친절한 대답과 함께 내 요구를 들어주는 인공지능 스피커. 이제는 이 편리한 생활을 즐길 일만 남았다.

기사 더보기

조재휘 기자

kkyaho13@sisunnews.co.kr