今回はキャラクターの話すスピードや声の高さを変更する設定方法についてご紹介します。
はじめに
声色を設定するためには、Watson Speech to textの設定を行います。
デフォルトだとスピードが一定で、テストを行うには声が非常にゆっくりに感じますし、本番環境でも若干キャラクターの話すスピードが遅いなと感じることがあリます。
AI interfaceではWatson assistantにタグを入れるだけで簡単にスピードの調節(Speech to textの設定)を行うことができます。
Speech to textで変更できること
pitch
声を高くしたり低くしたりする機能です。
Hzの数値が大きいほど高い声になります。
Hzの設定以外に6つの設定方法があります。
default
デフォルト設定x-low
ベースラインを12半音下げるlow
ベースラインを6半音下げるmedium
デフォルトと同じ動作high
ベースラインを6半音あげるx-high
ベースラインを12半音あげる
例:
1 2 3 4 5 6 |
<prosody pitch="150Hz">Transpose pitch to 150 Hz</prosody> <prosody pitch="-20Hz">Lower pitch by 20 Hz from baseline</prosody> <prosody pitch="+20Hz">Increase pitch by 20 Hz from baseline</prosody> <prosody pitch="-12st">Lower pitch by 12 semitones from baseline</prosody> <prosody pitch="+12st">Increase pitch by 12 semitones from baseline</prosody> <prosody pitch="x-low">Lower pitch by 12 semitones from baseline</prosody> |
rate
話すスピードを調節することができます。
数値が大きいほど話すスピードが早くなります。
default
デフォルトの設定x-slow
50%遅くするslow
25%遅くするmedium
デフォルトと同じ動作fast
25%早くするx-fast
50%早くする
この設定以外にもrateに数値を設定することができます。
rateに数値を設定すると1分あたりの単語数を設定することができるので、
50であれば1つの単語に1.2秒かける設定となり、
100であれば0.6秒の計算となります。
※IBM社が提供しているドキュメントは英語なので日本語では数字が異なる可能性があります。
1 |
<prosody rate="50">AI interfaceでできること</prosody> |
また相対的設定も可能です。
rateに任意でパーセントを入れることでスピードを早めることができます。
以下の設定であれば、何も設定していない状態に比べて10%早く話すという設定です。
1 |
<prosody rate="+10%">AI interfaceとは</prosody> |
例:
1 2 3 |
<prosody rate="slow">Decrease speaking rate by 25%</prosody> <prosody rate="50">Set speaking rate at 50 words per minute</prosody> <prosody rate="+5%">Increase speaking rate by 5 percent</prosody> |
volume
音量を調節することができます。
数値が大きいほど音量が大きくなります。
1~100の間の数字を指定することで音量の調節ができます。
x-soft
値が30の設定soft
値が50の設定medium
値が80の設定loud
値が90の設定default
値が92の設定x-loud
値が100の設定
例:
1 2 3 |
<prosody volume="75">Modified volume is 75</prosody> <prosody volume="88.9">Modified volume is 88.9</prosody> <prosody volume="loud">Modified volume is 90</prosody> |
Watson Assistantの設定方法
Watson AssistantのDialogで会話のスピードやピッチを変更したい「Text」部分に対して、以下の様にタグを入れます。
▼この設定だと早口 + 低い声で話す様になります。
1 |
<prosody rate="+100%" pitch="50Hz">こんにちは。ご用件をお伺いいたします。</prosody> |
これだけで設定完了です!
おわりに
声が違うとキャラクターの印象は大きく変わるのではないでしょうか?
皆さんもぜひ声の高さやスピード、声量をキャラクターに合わせて調節してみてください!
参考リンク
▼お問い合わせはこちら
ーーーーーーーーーーーーーーーーーーーーーーーー
【株式会社RAKUDO】
下記の事業を中心に行なっている名古屋の企業です。
●エンタメ系や製造業の方に向けたVR/AR/MR開発
●モーショントラッキングのデータ作成サービス
●AI開発が楽になるプラットフォーム「AI interface」
お困りのことがあれば些細なことでもお気軽にご連絡ください。
一緒にアイディアを形にしましょう!
ーーーーーーーーーーーーーーーーーーーーーーーー