臺語媠聲


#1
https://grants.g0v.tw/projects/5875bd8becdcf3001eb6bbb7
這是一個已從原 https://grants.g0v.tw/projects/5875bd8becdcf3001eb6bbb7 中分離的主題

#2

感謝您在萌典相關專案的熱情貢獻,我要向大家推薦您的後續之作!!


#3

看你不懈努力在為台語做努力,覺得十分感動。


#4

您好,不曉得50萬元的預算打算如何分配和規劃呢?


#5

謝謝提醒,這是我們的規劃:

§ 預計六個月內將花多少小時作這件事?需要多少經費?(30 萬到 50 萬)

  • 需50萬
  • 稅金5萬
  • 兩個工程師*每天8小時*每週3天*26週=1248小時,寫扣兼整理語料
  • 發音人王秀容老師( 教育部閩南語辭典發音人),60小時,5萬
  • 語料協助整理,iTaigi編輯們,總時數300小時,10萬

#6

不知 speech synthesis 是否可以導入如 Google DeepMind 團隊的 WaveNet 所用的 DNN-based generative model?

[1] https://deepmind.com/blog/wavenet-generative-model-raw-audio/


#7

這看起來很酷,音質上應該可以改善不少
現在合成的聲音還滿不自然的

不過到時需要試用看看 WaveNet
目前秀蓉老師的全部聲音大概10多個小時
不確定這樣的聲音數量,訓練出的模型會不會比HTS的parametric-based的還好

我把 WaveNet 註記里程碑 在語音合成debug機制
現在合成的瓶頸是 語料音韻規則
語料音韻規則 先補好,再來研究 Wavenet

PS:試聽他們的Concatenative,感覺也沒有很認真train XDD