Skip to content

VOICEVOXのイントネーション調整を手動でやるのが面倒だったため、自分の声でイントネーションを設定できるようにしました。

License

Unknown, LGPL-3.0 licenses found

Licenses found

Unknown
LICENSE
LGPL-3.0
LGPL_LICENSE
Notifications You must be signed in to change notification settings

nyankomaher/voicevox

This branch is 1 commit ahead of, 521 commits behind VOICEVOX/voicevox:main.

Folders and files

NameName
Last commit message
Last commit date
Jan 29, 2024
Mar 1, 2023
Dec 28, 2023
Jan 29, 2024
Jan 25, 2024
Jan 22, 2024
Apr 14, 2024
Apr 14, 2024
Jan 29, 2024
Aug 1, 2021
Apr 14, 2024
Nov 3, 2023
Jan 24, 2024
Jun 3, 2023
Apr 14, 2024
Feb 18, 2023
Apr 29, 2023
Nov 29, 2021
Apr 14, 2024
Jul 24, 2023
Aug 1, 2021
Nov 29, 2023
Apr 14, 2024
Mar 22, 2023
Aug 1, 2021
Jul 24, 2023
Apr 14, 2024
Jan 28, 2024
Jan 17, 2024
Apr 14, 2024
Apr 14, 2024
Jan 17, 2024
Oct 21, 2023
Nov 3, 2023

Repository files navigation

VOICEVOX with Your Voice

VOICEVOXのイントネーション調整を手動でやるのが面倒だったため、自分の声でイントネーションを設定できるようにしました。

⚠️EXPERIMENTAL⚠️
⚠️ADHOC⚠️

感謝

VOICEVOX

言わずと知れたVOICEVOXです。感謝。
https://voicevox.hiroshiba.jp/

各種音声解析ツール

これらのツールのお陰で発声した文字ごとにピッチを抽出することができます。感謝。
https://github.com/timmahrt/praatIO
https://github.com/julius-speech/segmentation-kit/tree/master
https://github.com/JeremyCCHsu/Python-Wrapper-for-World-Vocoder

前提

インストール

VOICEVOX

VOICEVOXをforkしていますので、まずはそちらのインストール手順を実行してください。

pythonライブラリ

pip install numpy scipy pyworld praatio

.env設定

# python
PYTHON=/path/to/your/python
# perl
PERL=/path/to/your/perl
# Julius 音素セグメンテーションキット
EXTERNAL_SEGMENTATION_KIT=/path/to/your/segmentation-kit
# TextGridConverter
EXTERNAL_TEXT_GRID_CONTAINER=/path/to/your/TextGridConverter

上記のほか、VITE_DEFAULT_ENGINE_INFOSのexecutionFilePathをお使いの環境のものに合わせてください。

使用方法

  1. fork元のVOICEVOXを参考にしてVOICEVOXを起動してください。
  2. セリフを入力し、イントネーション欄にセリフのイントネーションを表示させてください。
  3. イントネーション欄の左上にある、マイクアイコンの録音ボタンをクリックしてください。
  4. お好みのイントネーションでセリフを喋ってください。
  5. マイクアイコンを再度クリックしてください。録音が停止され、イントネーションが反映されます。

チューニング

人によって声の高さは違いますので、望みのピッチにするためにはチューニングが必要です。
public/python/extract_pitch.py の calc_adjusted_pitch を自分の声に合うように修正してください。

メモ

  • 基本的に、アクセントタブで正しく語句を区切って、アクセントを設定してあげればいい感じになることが多いです。基本的に、本ツールの出番はありません。
    • ちょっと変わったイントネーションにしたいときは効果があるかもしれません。
    • 話者の演技力の問題もあると思いますが、ピッチをうまく取ってくれたり取ってくれなかったりします。
    • 役に立ったり立たなかったりするツールです。
  • 入力デバイスを変更すると、VOICEVOXの再起動が必要になるようです。
    • コンソールにTextGridがNotFound的なエラーが出ますが、音声が取れていないためのようです。
    • MediaStreamを毎回作り直せば治る?
  • ノイズが少ない方が精度は良くなると思いますが、MacBookAirの内蔵マイクでもなんとかなるようです?

ライセンス

LGPL v3

About

VOICEVOXのイントネーション調整を手動でやるのが面倒だったため、自分の声でイントネーションを設定できるようにしました。

Resources

License

Unknown, LGPL-3.0 licenses found

Licenses found

Unknown
LICENSE
LGPL-3.0
LGPL_LICENSE

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • TypeScript 52.9%
  • Vue 38.9%
  • NSIS 4.2%
  • JavaScript 1.6%
  • Shell 1.3%
  • SCSS 0.8%
  • Other 0.3%