キャラクターの声色が自由自在!?Watson Speech to textの設定

キャラクターの声色が自由自在!?Watson Speech to textの設定

今回はキャラクターの話すスピードや声の高さを変更する設定方法についてご紹介します。

はじめに

声色を設定するためには、Watson Speech to textの設定を行います。

デフォルトだとスピードが一定で、テストを行うには声が非常にゆっくりに感じますし、本番環境でも若干キャラクターの話すスピードが遅いなと感じることがあリます。

AI interfaceではWatson assistantにタグを入れるだけで簡単にスピードの調節(Speech to textの設定)を行うことができます。

Speech to textで変更できること

pitch

声を高くしたり低くしたりする機能です。
声の高さの調整

Hzの数値が大きいほど高い声になります。
Hzの設定以外に6つの設定方法があります。

  • default デフォルト設定
  • x-low ベースラインを12半音下げる
  • low ベースラインを6半音下げる
  • medium デフォルトと同じ動作
  • high ベースラインを6半音あげる
  • x-high ベースラインを12半音あげる

例:

 

rate

話すスピードを調節することができます。
話すスピード調整

数値が大きいほど話すスピードが早くなります。

  • default デフォルトの設定
  • x-slow 50%遅くする
  • slow 25%遅くする
  • medium デフォルトと同じ動作
  • fast 25%早くする
  • x-fast 50%早くする

この設定以外にもrateに数値を設定することができます。
rateに数値を設定すると1分あたりの単語数を設定することができるので、
50であれば1つの単語に1.2秒かける設定となり、
100であれば0.6秒の計算となります。
※IBM社が提供しているドキュメントは英語なので日本語では数字が異なる可能性があります。

また相対的設定も可能です。
rateに任意でパーセントを入れることでスピードを早めることができます。
以下の設定であれば、何も設定していない状態に比べて10%早く話すという設定です。

例:

 

volume

音量を調節することができます。
音量調整

数値が大きいほど音量が大きくなります。
1~100の間の数字を指定することで音量の調節ができます。

  • x-soft 値が30の設定
  • soft 値が50の設定
  • medium 値が80の設定
  • loud 値が90の設定
  • default 値が92の設定
  • x-loud 値が100の設定

例:

 

Watson Assistantの設定方法

Watson AssistantのDialogで会話のスピードやピッチを変更したい「Text」部分に対して、以下の様にタグを入れます。

▼この設定だと早口 + 低い声で話す様になります。

 

これだけで設定完了です!

おわりに

声が違うとキャラクターの印象は大きく変わるのではないでしょうか?

皆さんもぜひ声の高さやスピード、声量をキャラクターに合わせて調節してみてください!

参考リンク

SSML elements


▼お問い合わせはこちら


ーーーーーーーーーーーーーーーーーーーーーーーー
【株式会社RAKUDO】
下記の事業を中心に行なっている名古屋の企業です。

●エンタメ系や製造業の方に向けたVR/AR/MR開発
●モーショントラッキングのデータ作成サービス
●AI開発が楽になるプラットフォーム「AI interface」

お困りのことがあれば些細なことでもお気軽にご連絡ください。
一緒にアイディアを形にしましょう!
ーーーーーーーーーーーーーーーーーーーーーーーー
AI interface 株式会社RAKUDO、100年後の働き方を創る

AI interfaceカテゴリの最新記事