音声認識の精度について|VR-RDシリーズ編

近年一般化し始めた音声認識ですが、テキストの利活用には認識精度の向上が欠かせません。
録音する環境や通話内容、音声認識エンジンの辞書登録など、認識精度に影響を与える注意事項や、お客様独自の「追加辞書」を作成するアドバイザリーサービスについてご紹介します。
1. 通話環境による認識精度の違い
音声認識では「周囲音が混ざった音声」「早口」「小さすぎる声/大きすぎる声」「聞き取りにくい声」などは認識しづらく、通話内容や録音環境などにより認識率は変化します。
「ゆっくりと発話する・語尾もしっかり発話する」といった丁寧な発話を心掛けていただくことで認識率を高めることができ、「オペレータがお客様の発話を復唱する」ことで、認識精度を一定に保つことが難しい顧客側の会話も正しく認識されテキストとして残りやすくなります。
※スピーカフォン、対面マイクなどをご利用の場合、「周りの周囲音」「スピーカーフォン、対面マイクと話す方の距離」などの影響で電話の通話と比較して認識精度がよくない場合があります。

認識精度が高い発話
- 丁寧、ゆっくり、流暢で適正な声の発話
- 文節がしっかりとした発話

認識精度が低い発話
- 早口、乱雑な会話、活舌が悪い
- 周囲音が入るなど聞き取りにくい発話
2. 認識精度の向上へのアプローチ
タカコムの音声認識搭載シリーズ「VR-RD790」「VR-RDS120」「VR-RD920CES」には、音声認識エンジンの辞書として「標準言語モデル」が搭載されていますが、お客様にて「追加辞書」を登録していただくことで音声認識精度向上が図れます。
さらに「業界特有の話し言葉」などお客様の通話内容に対応した「追加言語モデル」を追加登録することにより、さらなる認識精度の向上が期待できます。

追加言語モデルを登録するには、以下の3つの方法があります。
【1】お客様自身で登録用のテキストデータ作成および登録を行う
【2】辞書セルフメンテナンス機能で登録を行う
【3】弊社にて作成する有償のオプションサービス「アドバイザリーサービス」 をご利用いただく
3. アドバイザリーサービスのご紹介
弊社では、更なる認識精度の向上として、ご利用される通話内容に対応したお客様独自の「追加言語モデル」を作成する有償のオプションサービス「アドバイザリーサービス」をご用意しています。

※認識精度は録音された音声の状態(口調、周囲ノイズ等)により変化します。お客様が希望されます認識精度をお約束することが困難となりますのであらかじめご承知おきください。
※ご提供いただくデータにはお客様の個人情報が含まれます。別途弊社にて用意します「個人情報の利用規約」に同意をお願いいたします。
※ご提供いただくデータによって認識精度は変化します。提供いただくデータは、様々なフレーズのあるデータをご用意ください。
※ご提供いただいたデータによって認識精度の向上が確認できず、追加でデータを用意いただき作業実施する場合は、別途費用となりますのであらかじめご承知おきください。
4. 対象製品のご紹介
「通話録音」+「音声認識」一体モデル|VR-RD790
通話録音装置に音声認識機能を標準搭載。通話録音の新規導入や買替などの際にご導入いただくことで、コストを抑えて音声認識をご利用いただけます。

通話録音装置と連携してテキスト化|VR-RDS120
タカコム製通話録音装置と連携して、全通話のテキスト化を導入できます。既存の電話設備や要件などに合わせて機器選定を柔軟に行えます。
複数拠点の音声を収集+テキスト化|VR-RD920CES
複数拠点の通話録音装置から音声データを収集し、全文テキスト化が可能です。データ活用の促進はもちろん、膨大に蓄積されるデータ管理の安全性向上や管理コスト低減も期待できます。