AI 스피커 사용해보니.. ‘뉴스와 콘텐츠’ 내가 선택하고 구매한 음성으로 들을 수 없나? [과학it슈]
AI 스피커 사용해보니.. ‘뉴스와 콘텐츠’ 내가 선택하고 구매한 음성으로 들을 수 없나? [과학it슈]
  • 보도본부 | 김아련 기자
  • 승인 2020.08.03 13:29
  • 댓글 0
이 기사를 공유합니다

[시선뉴스 김아련] 텍스트를 음성으로 바꿔주는 기술들이 우리의 일상에 빠르게 다가오고 있다.

최근에는 인공지능(AI) 기술을 활용한 '음성합성 기술'의 발전으로 인해 텍스트를 음성으로 변환하여 디지털뉴스 및 콘텐츠에 활용하는 움직임들도 활발해지고 있다.

국내 기업들의 움직임도 활발하다. 네이버, 카카오, 삼성, LG, KT, SK텔레콤, 네오사피엔스, 휴멜로, 마인즈랩 등 다양한 기업들의 참여가 눈에 띈다.

텍스트 음성 변환(TTS) 기술을 이용해 유명 연예인들의 목소리로 디지털북이나 콘텐츠를 들어 볼 수도 있고 다양한 기업들이 관련 제품을 선보이고 있다.

하지만 시중에 공급되고 있는 관련 제품들을 실제 사용해 보니 몇가지 아쉬운 부분들도 있었다.

현재는 해당 기술들이 실제 적용 초입단계라 그런지 가장 중요한 ‘사용자 맞춤형 서비스에 대한 니즈 반영’ 이 다소 부족하다는 느낌을 받았다.

사용자 입장에서 본 AI 음성합성 기술 제품들의 보완점 또는 발전 방향을 몇가지 적어보고자 한다. 지극히 개인적인 바램이 될 수도 있겠지만, 아래 내용들이 반영된다면 보다 많은 사용자의 참여와 시장 확대가 되지 않을까 생각해 본다.

◆ 사용자가 선택 가능한 ‘다양한 특정인의 음성 데이터’ 필요해

현재는 음성합성 기술을 활용한 제품들에서 제공하는 음성은 매우 제한적이라는 느낌이다. 완전한 기계음 또는 특정 유명인의 목소리 몇 명 뿐이었다.

즉 제품을 공급하는 공급자(기업) 측에서 제공하는 음성만을 들을 수 있다는 단점이 있었다.

물론 기업들의 입장도 당연히 이해가 된다.

사용자 입장에선 해당 음성들도 무료로 이용이 가능하지만, 공급자 측면에서는 유명 연예인들의 목소리 등과 같은 경우 서비스 제공을 위해선 상당한 사용료를 지불해야 되기 때문일 것이다.

그럼에도 불구하고, 사용자 입장에선 보다 다양한 목소리로 개별 장르의 뉴스나 콘텐츠들을 듣고싶은 생각이 들었다.

일례로, 만약 특정 섹션을 구분하자면 피겨스케이팅의 소식은 김연아 선수의 목소리로, 야구 관련 소식은 박찬호 선수의 목소리로, 정치 관련 소식들은 김대중 대통령의 목소리로 사용자가 직접 선택해서 들을 수 있으면 좋겠다는 생각이 들었다.

물론, 다양한 산업분야에 유명인들의 목소리를 사용할 경우 당연히 사용료를 지불해야겠지만, 사용자 입장에서도 기능상의 편의성과 니즈 충족이 된다면 얼마든지 지불 가능한 금액선이라면 지불할 수 있다는 생각이 들었다.

◆ 내 목소리, 아빠, 할머니 목소리로는 들을 수 없나?

제품들을 사용해 보면서 든 또하나의 생각은 사용자의 목소리를 마이크를 통해 직접 입력하고, 저장해서 사용자의 목소리로 다양한 콘텐츠를 들을 수 있는 기능이 있으면 좋겠다는 생각이 들었다.

그렇게 되면, 사용자 본인의 목소리, 또는 아버지,어머니, 할머니 등의 목소리 등을 마이크를 통해 입력하고 저장해 놓으면 디지털환경에 있는 모든 콘텐츠들을 사용자가 직접 입력하고 사용자 자신이 저장한 목소리로 들을 수 있게 된다.

나의 자식들에게 할머니의 목소리로 또는 엄마의 목소리로 언제라도 콘텐츠를 읽어 줄 수 있다면 좋을 것 같다는 생각이 들었다.

외국어 공부는 덤으로 되는 셈이니까 동시에 다양한 국가의 언어로도 들을 수 있다면 도움이 될 것이다.

◆ 목소리를 팔고 살수 있는 상점 기능이 없던데

지금은 AI 음성 제공관련 제품의 경우 기업 입장에서 제공하는 특정인들 몇명의 목소리들만 일부 들어 볼수 있다.

'내가 유명인들을 대신해 그의 목소리를 판매할 수 있는 상점이 있으면 좋지 않을까?' 문득 이런 생각이 들었다.

물론 내가 직접 해당 유명인의 목소리에 대한 사용권을 획득해야 되겠지만, 그들의 좋은 목소리를 올리고, 마켓에 등록해 팔아서 사용자가 수익을 창출할 수 있는 그런 장터들이 마련된다면 사용자들의 참여를 불러 일으킬 수 있지 않을까?

아마도 단순 기계음과 특정인 몇 명의 목소리만 제공하는 제품들보다 폭발적인 사용자 유입이 가능할 것 같다.

◆ 음성만 들었더니 지루함도 오던데

직접 사용해보니 지루함을 달랠 뭔가가 필요하다는 생각이 들었다. 뭐 배경음이 좀 깔린다던지, 다양한 억양과 감정을 느낄 수 있는 기능들도 추가되었으면 하는 생각도 들었다.

물론 여기서 포인트는 이런 기능들이 사용자가 직접 그 사용여부를 선택할 수 있도록 하고, 이런 기능들도 별도 구비되어 제공되어야 한다는 것이다.

결국엔 사용자 맞춤형 서비스가 필요하다는 생각이 강하게 들었다.

◆ 결국엔 사용자 맞춤형 니즈로 가야된다

콘텐츠들도 산업, 경제, 연예, 스포츠, 문화 등 다양한 분야가 있듯이 사용자가 각 분야별로 적합한 목소리의 주인공을 선택, 구매 또는 설정해서 들을 수 있도록 기능들이 제공되면 좋을 것 같다. 즉 사용자 니즈를 충족시키는 서비스가 나왔으면 한다.

사실 이런건 온라인뉴스 또는 포털 시장에서는 더 적합할 수 있다는 생각도 드는데 위와 같이 온라인상에서 콘텐츠를 제공하는 섹터의 경우 섹션별로 콘텐츠들이 나뉘어져 있기 때문에 각 섹션별 추천인 목소리들도 반영해 구비할 수 있다는 생각이다.

그렇다면 사용자는 자신이 구매한 특정인의 음성을 특정 기간 동안 들을 수도 있고, 또는 자신의 목소리를 입력해 저장해서 해당 목소리로도 들을 수도 있다. 외국어로 듣고 싶으면 다양한 외국어로 들으면서 자연스럽게 외국어 공부도 가능할 것이다.

연예·스포츠 인기뉴스
오늘의 주요뉴스