Voice Replacement Program

Development of a voice audio replacement program for video content using deep learning speech synthesize technology

This Project is Industry-academic cooperation(MayFarm).
중요한 소스코드는 삭제했습니다.

Information

교육 동영상 시장이 확대되면서 성우를 기용해 제작된 영상들 또한 늘고 있는 실정이다. 이렇게 제작된 영상의 경우 추후 수정 작업이 생길 때 해당 영상을 녹음한 성우를 재섭외하여 다시 녹음해야 한다는 불 편함이 생기는데 이는 교육 동영상 제작 업체에게 시간적, 금전적으로 부담이 될 수 있다. 이러한 문제를 해결하기 위해 딥러닝 음성 합성 모델인 Tacotron2를 통해 한국어 기반 음성 합성을 할 수 있다. 이러한 음성 합성 기술을 사용하여 사용자는 동영상의 특정 성우의 목소리를 저장하고 학습용 데이터로 가공할 수 있다. 이렇게 학습한 음성 합성 모델을 사용해서 성우의 목소리와 유사한 음성을 합성할 수 있다. 우리 는 만들어진 음성을 가지고 영상의 부분 음성 교체를 진행하며 수정한 영상을 설문자에게 의뢰한 결과 5 점 만점에서 4.77점을 기록했다. 이를 활용하여 우리는 학습용 교육 동영상을 제작하는 과정에서 발생하 는 비용의 비효율성을 개선할 수 있을 것이라고 기대한다.

Demo

Presentation

KDBC 2021

Reference

Speech Synthesize Model

Tacotron2

GitHub

Libraries

Pydub

MoviePy

Tensorflow

Datasets

KSS DataSets

Develop Environment

Linux, MacOS(Big Sur, Intel)
Pycharm
Python
Django
MariaDB

How to Start

conda activate Your Environment
cd Your Path

python manage.py YourIP:PORT

Requirement

tensorflow-gpu == 1.8.0
cudatoolkit == 9.0
cudnn == 7.6.0
ffmpeg == 4.0
pydub == 0.25.1
moviepy == 1.0.3
jamo == 0.4.1

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
assets/image		assets/image
tacotron		tacotron
.gitignore		.gitignore
README.md		README.md
manage.py		manage.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Voice Replacement Program

Information

Demo

Presentation

Reference

Develop Environment

How to Start

Requirement

About

Uh oh!

Releases

Packages

Languages

threhe13/Voice-replacement-program

Folders and files

Latest commit

History

Repository files navigation

Voice Replacement Program

Information

Demo

Presentation

Reference

Develop Environment

How to Start

Requirement

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages