Skip to content

InuInu2022/YMM4OpenJTalkPlugin

Repository files navigation

YMM4 Open JTalk プラグイン

cover

これはなに?

YMM4のボイスとして Open JTalk」(オープンジェイトーク) を使えるようにしたプラグインです。

SHABERU」のボイスも追加して利用することができます。

不具合を見つけたら、YMM4本体ではなくgithub issuesなどで報告してください!

対応バージョン

  • YMM v4.35.xx 以降

使い方

  1. プラグインをインストールする
  2. (初回)キャラクター設定で「YMM4 Open JTalk プラグインの声質を再読み込み」
  3. キャラクターを作る
  4. 作ったキャラクターを選んだ状態でセリフを入力する

パラメータ

セリフ毎に設定できる次のパラメータがあります。

  • 話速 (speed)
  • 大きさ (volume)
  • 高さ (pitch)
  • 声質詳細 (alpha)
  • 抑揚 (gvWeightLF0)

また詳細パラメータもありますが、基本的に触らなくてOKです。

  • 無声音閾値 (msdThreshold)
  • 遷移平滑度(beta)
  • スペクトル変動重み (gvWeightSpectrum)

感情(スタイル)

  • v0.1では数値が一番大きいスタイルが選ばれます。感情合成はできません。
  • スタイルが1種類のボイスはパラメータを弄っても変化ありません

インストール方法

Releases 以下にある最新のバージョンのYMM4OpenJTalkPlugin.v.***.ymmeをインストールしてください。

ymmeファイルをダブルクリックするとインストールが始まります。

インストール後、「キャラクター設定」の「ボイス」で、「YMM4 Open JTalk プラグインの声質を再読み込み」を選択して、現在のボイスライブラリ(音響モデル)を取得してください。 ※新しくボイスライブラリ(音響モデル)を増やすたびに必要です

ニコニコモンズ

ニコニコに投稿する際には以下のコンテンツIDを親子登録してください。

コモンズ(nc401437)

(YMM4の素材一覧からも確認できます。)

プラグインの更新

プラグインの設定画面から更新確認とダウンロードができます。 ymmeファイルをダブルクリックするとインストールが始まります。

デフォルトで使えるボイスライブラリ(音響モデル)

以下のボイスが初期インストールされています。

  • 女声: tohoku-f01
  • 男性: m001
  • 女声: メイ
  • 男性: タクミ

! 注意 v0.1ではスタイル(感情)の合成には対応していません

------------------------------------------
HTS Voice "Mei", released by MMDAgent Project Team
Copyright (c) 2009-2018  Nagoya Institute of Technology Department of Computer Science

This work is licensed under the Creative Commons Attribution 3.0 license.
------------------------------------------
HTS Voice "Takumi", released by MMDAgent Project Team
Copyright (c) 2017-2018  Nagoya Institute of Technology Department of Computer Science

This work is licensed under the Creative Commons Attribution 3.0 license.
------------------------------------------
HTS voice tohoku-f01-{angry,happy,neutral,sad}
Copyright(c) 2015 Intelligent Communication Network (Ito-Nose) Laboratory
                  Tohoku University.
This work is licensed under the Creative Commons Attribution 4.0 license (CC-BY 4.0)
------------------------------------------
The Nitech Japanese Speech Database "NIT ATR503 M001", released by HTS Working Group
Copyright (c) 2003-2012  Nagoya Institute of Technology
Department of Computer Science

This work is licensed under the Creative Commons Attribution 3.0 license.
--------------------------------------------

ボイスライブラリ(音響モデル)を追加する場合

  1. プラグインのインストール先フォルダのvoices以下にデータを置く
  2. voices.jsonを書き換える
  3. 「YMM4 Open JTalk プラグインの声質を再読み込み」をして指定

voices.json 参考

{
    "Name": "女声: tohoku-f01",
    "Id": "tohoku-f01",
    "Terms": "https://github.com/icn-lab/htsvoice-tohoku-f01/blob/master/COPYRIGHT.txt",
    "FileSize": "",
    "Author": "東北大学 伊藤・能勢研究室(ICN Lab.)",
    "ContentId": "",
    "StylePaths": {
        "neutral" : "tohoku-f01-neutral.htsvoice",
        "happy" : "tohoku-f01-happy.htsvoice",
        "angry" : "tohoku-f01-angry.htsvoice",
        "sad" : "tohoku-f01-sad.htsvoice"
    }
},
  • "Id"voices以下のデータを置いたフォルダ名と一致させてください

ボイスライブラリ(音響モデル)

htsvoice形式の音響モデルがボイスライブラリとして利用できます。

License

MIT License

Copyright (c) 2024 InuInu