メインコンテンツまでスキップ

ヒント

単語の登録数

登録する単語はプロファイルごとに1,000個を目安にしてください。マイページからは1,000個までしか登録できません。

エンジンごとに語彙が決まっており、その語彙に含まれない単語は絶対に認識されません。1,000個を超えてしまっても、単語登録しておくほうが良い場合もあります。ただし、新たに追加した単語が、発音の似た他の単語と誤って認識されてしまう可能性が生じます。多くの単語を登録することによって、こういった誤りを増やしてしまい、かえって認識精度を下げてしまう場合があることに注意してください。

また、単語の登録数が増えると、音声認識の際にプロファイルの読み込みに時間がかかったり、音声認識の時間が増大したりするデメリットがあります。特にプロファイルの読み込みの時間は、登録単語数に対して指数関数的に増大します。リクエスト時にリクエストパラメータのprofileWordsに単語を設定する場合も、同様に注意してください。

ガイドライン

一般的な注意として以下に気をつけてください。

  • 対応するクラスがある場合は、クラスを指定して単語登録する。
  • 音節が少ない単語は誤って認識されやすいので、追加しないか、必ずクラスを指定する。
  • 読みが長すぎる単語を登録しない。 固有名詞などで読みが長い単語を登録したい場合は、単語を分割して登録することを検討してください。たとえば駅名の「南阿蘇水の生まれる里白水高原駅」を登録したい場合、単語登録無しでも認識できそうな一般的な単語の部分を除いて、「南阿蘇」「白水高原」を地名クラスに登録することが一つの案です。
  • 同じクラスに同じ読みの単語を登録しない。 違うクラスに同じ読みの単語を登録する場合は、文脈によって認識し分けることも期待できますが、完璧に認識し分けられるとは限らない点に留意してください。
  • 認識結果を期待する表記に書き換えるため、という理由で単語登録を利用しない。 たとえば「子ども」と認識してほしいのに認識結果には「子供」と出力される、というようなケースがあります。このような場合に「子ども」という認識結果を得ようとして単語登録を行うようなことは推奨されません。登録した単語で必ず認識されるわけではなく、逆に発話していないのに登録した単語で誤認識されるリスクもあります。認識結果を期待する表記に書き換えたい場合は、クライアントのプログラムにおいて後処理を行ってください。
  • 話されることのないであろう単語を、念の為にといった理由で追加しない。 サービスや業界の単語リストのようなものがある場合、全てを一括で登録するのではなく、上記の注意点等を考慮して登録する単語を取捨選択してください。