https://grants.g0v.tw/projects/5875bd8becdcf3001eb6bbb7
這是一個已從原 https://grants.g0v.tw/projects/5875bd8becdcf3001eb6bbb7 中分離的主題
臺語媠聲
system
#1
koansin.tan
#6
不知 speech synthesis 是否可以導入如 Google DeepMind 團隊的 WaveNet 所用的 DNN-based generative model?
[1] https://deepmind.com/blog/wavenet-generative-model-raw-audio/
ihcaoe
#7
這看起來很酷,音質上應該可以改善不少
現在合成的聲音還滿不自然的
不過到時需要試用看看 WaveNet
,
目前秀蓉老師的全部聲音大概10多個小時
不確定這樣的聲音數量,訓練出的模型會不會比HTS的parametric-based的還好
我把 WaveNet
註記里程碑 在語音合成debug機制
現在合成的瓶頸是 語料
和 音韻規則
等 語料
和 音韻規則
先補好,再來研究 Wavenet
PS:試聽他們的Concatenative,感覺也沒有很認真train XDD