AI 알고리즘에 의해 목소리 구현 제약 없고 수천가지 목소리 재현도 가능
텍스트 입력하면 음성 자동 생성

[뉴스워치= 정호 기자] CJ올리브네트웍스가 시청소외계층을 위한 기술 개발에 힘쓰고 있는 가운데, tvN과 함께 시각 장애인을 위한 화면 해설 방송에 AI기술을 도입해 주목을 받고 있다.

화면 해설 방송은 시각 장애인을 위해 해설자가 등장인물의 표정이나 몸짓, 장면전환 등 화면의 전체적인 내용을 음성으로 설명해 주는 방송이다.

기존의 일반적인 해설 방송은 화면을 음성으로 해설해주는 음원을 녹음해 주음성과 믹싱한 후 부음성에 실어 음성다중으로 송출하는 방식이다. 최종 편집 후 다시 사운드 믹싱을 해야하기 때문에 제작 시간이 그만큼 길게 소요된다.

5일 CJ올리브네트웍스에 따르면 'AI 보이스 클로닝'은 AI(인공지능) 알고리즘에 의한 개인별 음성 분석 및 자동 생성이 가능한 음성합성 기술이다. 음성을 학습한 뒤 텍스트를 입력하면 원하는 목소리를 자동으로 생성할 수 있다. 때문에 이 기술로 매 콘텐츠마다 전체 지문을 녹음하지 않아도 일정 시간 녹음해 둔 목소리를 기반으로 AI가 여러 프로그램의 화면 해설 음성을 자동으로 생성 가능하다.

tvN토일 드라마 '환혼' 화면 해설 방송에 배우 전미도가 내레이션으로 참여, 시각장애인들에게 특별한 경험 선사./사진=CJ올리브네트웍스
tvN토일 드라마 '환혼' 화면 해설 방송에 배우 전미도가 내레이션으로 참여, 시각장애인들에게 특별한 경험 선사./사진=CJ올리브네트웍스

tvN은 AI 보이스 클로닝 기술이 적용된 화면 해설 방송의 내레이션으로 배우 전미도와 함께 했다. 전미도는 AI 학습을 위해 다양한 예시 문장을 녹음했고 이를 활용해 전미도의 목소리로 tvN토일 드라마 '환혼'을 설명하는 화면 해설 방송을 제작했다.

이현기 CJ올리브네트웍스 Virtual Human Lab 팀장은 "상대적으로 콘텐츠 시청에 제약이 있는 시각 장애인들이 AI 보이스 클로닝을 통해 색다른 화면 해설 방송을 경험할 수 있게 돼 매우 뜻 깊게 생각한다"며 "시청소외계층을 포함한 모든 시청자들이 차별화된 콘텐츠 경험과 높은 몰입으로 감동을 느낄 수 있도록 미디어 AI기술 개발에 박차를 가하겠다"고 말했다.

한편 CJ올리브네트웍스는 시각장애인을 위한 e북 제작 및 장애인 영화제 후원 등 사회공헌 활동을 전개해나가고 있다.

정호 기자 newswatch@newswatch.kr

저작권자 © 뉴스워치 무단전재 및 재배포 금지