merlinという音声合成のオープンソースを使い音声を作成しています。
内部の設定の把握などをするために今まではHTSのサンプル音声(ATR503文)を流用していました。
最近音声を収録して行い始めたのですが音声を収録して加工・編集するのが大変で数を増やせません。
そこで収録した音声の水増しをしたいのです。
とりあえず聞き取れるレベルになればいいので。
しかし、音声の水増しの方法がわかりません。
画像の場合は拡大縮小、色彩、配置、回転などとあるそうですが、音声の場合どのように水増しすればいいのでしょうか?
速度、音量、エコー、ノイズ、どれも鮮明ではなくなり結果に悪影響を与えそうです。
現状できるのは音声を切ってつなぎ合わせて新しい音声を作るぐらいです。
どなたか音声の水増しの方法を知らないでしょうか?
収録で増やすのは難しい環境ですのでよろしくお願いします。
あなたの回答
tips
プレビュー