音声認識のメリットとは?|通話録音+音声認識の活用法
通話録音+テキスト化で業務効率化・生産性向上などの課題解決に
コールセンターだけでなく一般企業にも「通話録音」が広く普及する中で、企業には膨大な音声ビッグデータが蓄積されています。また、そのデータを分析し業務効率化や、サービス向上・商品開発などに活用するサービスも普及しつつあります。
音声データの利活用を進める上で、注目を集めているのが「音声認識システム」です。AI技術の急速な発展に伴い、目にする機会が増え、徐々に導入企業も増える一方で「結局、何の役に立つの?」「導入する準備には何が必要なの?」「投資に見合う費用対効果はあるの?」など、自社での導入をイメージしづらいのも現実です。
そんな、音声認識のメリットや導入する上でのポイントをご紹介いたしますので、音声認識システム利用のご検討にぜひお役立てください。
1. 音声認識によって解決できる課題とは
目的や用途、ご導入業種などにより解決すべき課題も様々。
企業に蓄積されている音声データをテキスト化・利活用することで得られるメリットについてご説明します。
課題.1
コンプライアンス監視の業務負荷を軽減したい
販売時にコンプライアンスに違反した説明をしていないか」「適切にリスク説明を行えているか」「オペレータの応対スキルに問題はないか」など、モニタリングを行うには膨大な時間と労力が必要になります。
日々蓄積される通話をすべてチェックすることは現実的ではありませんが、抽出する件数が少ないと重要な通話の確認が漏れる可能性も高くなります。
そこで音声認識の導入が大きく貢献します。
すべての通話を「テキスト化」することで
- NGワードなど特定のキーワードを含んだ通話を、検索で絞り込むことができる
- 通話をテキストで可視化でき、斜め読みすることができる
- テキストで表示した通話から、聞き直したい箇所を指定して音声の再生ができる
など、音声だけで行うモニタリングと比べ、業務の負荷を大幅に軽減することができます。
課題.2
オペレータの応対スキルを向上したい
電話応対スキルの向上は、顧客満足度の向上や成約率の向上に繋がることはもちろん、オペレータ自身の不安解消や自信醸成ができるため、離職の抑制にも繋がります。
マニュアル化された教育だけでは、オペレータ一人ひとりに適切な指示が難しい一方、それぞれの「話法」や「癖」などを把握・改善するためには膨大に蓄積された通話記録をチェックする必要があります。
そこで「テキスト化」を利用することで、音声を聞くことなくオペレータの話法を把握できます。
- ベテランスタッフの話法を、トークスクリプトとして容易に
- 通話の見える化で、口癖などを客観的に把握できる
- 挨拶やお礼など、基本的なマナーの実践をテキスト検索で確認できる
など、効率的に確認や分析が必要な通話を見つけ出し、電話応対スキル向上に活かす上でも効果を発揮します。
また、オペレータの発話の認識精度を見ることで、客観的な発話の品質測定にも利用できます。
課題.3
応対履歴入力や報告書作成を省力化したい
応対履歴の入力や、緊急対応時の報告書作成など、電話応対の記録文書作成にも少なからず時間を取られます。
また、記録作成者により入力品質にバラつきがあったり、個人の解釈や感情が入るなど、信頼性・正確性が問題になることも。
そのような「後処理」を効率化し品質を高める上でも「テキスト化」は有効に活用できます。
- テキスト化された通話を利用し、追記・修正のみで迅速に作成できる
- 客観的なテキストを基に、記入漏れや記録間違いなどを軽減できる
- 通話の聞き直しは必要な部分だけに絞ることができ、大幅に時間を短縮できる
など、いままで通話を聞き直しながら行っていた記録作成を効率化・平準化することができます。
課題.4
お客様の要望やクレームを活かしたい
お客様対応部門に蓄積される「顧客の声」には、商品・サービスの品質向上や経営改善などのきっかけが埋もれています。
「VOC活用」という言葉が使われるようになって久しい中、「膨大な応対記録の中から、貴重な生の声をいかに抽出するか」「どのように分析して全社共有するのか」など、解決すべき課題も多く残っています。
効果的にVOC活用を運用する上でも、通話のテキスト化が大変有用です。
- 通話録音で蓄積されている音声を、集計可能なテキストとして活用できる
- キーワードごとの発話頻度など数値化が容易になる
- クレームをテキストで俯瞰して確認でき、きっかけや対応策、改善策を客観的に検討できる
など、限られた部署に溜められていた音声ビッグデータを、数値化でき客観的なデータとして共有が可能になります。
2. 音声認識導入のポイントとは
音声認識に限らず、システム導入を進めるには効果を最大化させ、想定する成果を上げる必要があります。
問題点や課題の把握、費用対効果など、失敗しない音声認識導入のためにご検討ください。
ポイント.1
テキスト化の認識精度・利便性
音声認識では「周囲音が混ざった音声」「早口」「小さすぎる声/大きすぎる声」「聞き取りにくい声」などは認識しづらく、通話内容によって認識率は変化します。
企業・業界特有の専門用語やフレーズを登録するなど、利用環境に合わせて音声認識エンジンを「チューニング」することで、認識精度の向上は図ることができますが、100%正確に認識できるわけではありません。
- どの程度の認識率であれば利用価値があるのか
- 認識してほしいキーワードがテキストとして残せているのか
など、自社でどのように使用するのかを想定した上で認識精度を想定する必要があります。
また、チューニング以外でも「ゆっくりと発話する・語尾もしっかり発話する」といった丁寧な発話を心掛けていただくことで認識率を高めることができ、「オペレータがお客様の発話を復唱する」ことで、認識精度を一定に保つことが難しい顧客側の会話も正しく認識されテキストとして残りやすくなります。
ポイント.2
必要になるコスト・運用環境
まずは「何のために導入するのか」「どういった効果を期待するのか」など、音声認識導入に向けた効果を明確に設定しましょう。
「モニタリング業務に掛かる時間を3割削減できれば、○○時間分の残業抑制につながる」
「後処理時間を1/3に短縮することで、放棄呼率○○%低減が想定できる」
など、具体的に想定することで「どの程度の認識精度が必要なのか」「どの程度の利用頻度になるのか」などがイメージができます。
また、データの蓄積やツール利用の社内浸透など、ある程度の期間の利用を想定した検討が必要です。
音声認識ベンダーによって異なるさまざまなコストを「イニシャルコスト(初期費用)」「ランニングコスト(維持費用)」に分けて、トータルコストで考えることが大切です。
「後処理時間を1/3に短縮することで、放棄呼率○○%低減が想定できる」
など、具体的に想定することで「どの程度の認識精度が必要なのか」「どの程度の利用頻度になるのか」などがイメージができます。
- 必要な機能の絞り込みや、既存の自社設備の活用など、最適なシステムを選定してイニシャルコストを抑えられないか
- 利用頻度の増加やチューニングなど、継続利用する上で増加するランニングコストを想定できているか
- トータルで必要になるコストは、効率化できる業務と比較して費用対効果を生むのか
など、利用目的を達成しながら、過剰な投資にならないように最適なシステムを選定することをお勧めします。
3. タカコムがご提供する音声認識搭載モデルのご紹介
■ トータルコストを抑えて音声認識を導入
音声認識エンジンのライセンスは初回費用のみで、従量課金制などのランニングコストが不要です。クラウドへの接続も不要です。
■ 自社で音声認識エンジンのチューニングが可能
業界特有の用語を含むテキストデータや、会社名・製品名などの単語を登録することができ、自社で認識率の向上を図ることができます。
また、単語リストとして「変換する単語」と「類似単語」を登録することにより、音声認識時に類似単語を任意の文字に自動変換できます。
■ 既存の電話設備や要件によって選べるラインナップ
コストを抑えて通話録音と音声認識を一体化したモデルや、既設の通話録音装置と連携する音声認識サーバ、複数拠点の通話録音装置から音声データを収集し全文テキスト化する音声データ集中管理システムといった、用途や要件によって選べる 製品をラインナップしています。
「通話録音」+「音声認識」一体モデル ┃ VR-RD790【2024年12月発売予定】
通話録音装置に音声認識機能を標準搭載。通話録音の新規導入や買替などの際にご導入いただくことで、コストを抑えて音声認識をご利用いただけます。
通話録音装置と連携してテキスト化 ┃ VR-RDS120【2024年10月発売予定】
タカコム製通話録音装置と連携して、全通話のテキスト化を導入できます。既存の電話設備や要件などに合わせて機器選定を柔軟に行えます。
複数拠点の音声を収集+テキスト化 ┃ VR-RD920CES
複数拠点の通話録音装置から音声データを収集し、全文テキスト化が可能です。データ活用の促進はもちろん、膨大に蓄積されるデータ管理の安全性向上や管理コスト低減も期待できます。
PCアプリでリアルタイム音声認識 ┃ VR-RS100RDW
買い切りのPCアプリ、永久ライセンスでランニングコスト不要です。1席単位でコストを抑えてリアルタイム音声認識が導入できます。