HOME > プレスリリース > 音声認識の精度を格段に向上させるPA技術の開発に…

音声認識の精度を格段に向上させるPA技術の開発に成功

カテゴリー:プレスリリース

2007/4/9

株式会社ピートゥピーエー(略称:PtoPA、本社:東京都江東区有明3-1-25、社長:黄 声揚、自然言語によるAI自動会話システムの研究開発会社として平成12年7月7日に設立)は、平成19年4月9日、雑音の多い環境でも音声認識が高い精度で行える独自の「PA技術」の開発に成功したことを発表いたしました。PA:Prosody Analyzer(韻律解析システム)

音声認識の結果は、周囲の雑音や話者の話し方によって大きな影響を受けます。このため、これまでの音声認識技術の開発は、雑音の無い環境でしかも正しく発話されると言う理想的な条件を設定して進められてきました。しかしながら、音声認識の実用化を目指してきた多くのエンジニアは、このような理想的な環境の中で開発されてきた音声認識技術が、現実の場面ではどこまで役に立つのだろうかと大きな疑問を抱えていました。特にコミュニケーションロボットのように、雑音の中で音声会話を行うような状況では大きな問題であったのです。また雑音問題以外にも、小さくささやくような声や怒鳴るような大声が認識できない、さらには電話などでの通信中のパケットロスによる音質劣化で認識不能になる等、認識ができなくなる要因が多々あり、音声認識技術の普及を阻んできました。音声認識の飛躍的な精度向上のためには、これら認識が不可能な話者音声や音質劣化を知的に検出し、話者に発声のしなおしをさせるような仕組みが必要とされていたのです。

PtoPAの「PA技術」はこの音声を細かく分析し、雑音データと音声データを高い精度で分離したり、認識が不可能となった音声をきちんと識別して発話のしなおしを話者に促すことのできる、音声分野の新しい技術です。このPA技術では、時間領域での音声波形特性に着目して、複数の会話がある中で自動会話をするべき主会話を見つけ出す技術や、大きい声や小さい声などの認識不能な音声を聞き分ける技術、物を落したり何かがぶつかったりして発生する突発音や舌打ちなどの口から発する雑音を聞き分けてカットする技術を実現しています。さらには、ナレッジベースに収められた会話シナリオを参照して発話音声を判定する技術の開発により、従来にない高精度な音声認識を達成いたしました。
この「PA技術」の知的な検出機能と、話者とのコミュニケーションを通して音声認識率を高めていくテクノロジーが音声認識の飛躍的な進化へとつながったのです。今後は、高性能音声認識ソフト「Julius」を応用した音声認識システムや音声応答システムの精度を大幅に向上させ、様々な音声アプリケーションの実用化を促進いたします。

PtoPAではこれら音声認識をインテリジェント化した「PA技術」を、汎用音声会話プラットフォームとして近々発表予定の「VOICE CAIWA」に搭載していく意向です。今後は幅広いビジネス分野での応用も期待され、電話を使った音声での自動FAQを始め、カーナビ、ロボット、動画や音声を融合させたインタラクティブ映像コンテンツや音声によるeラーニングシステム、さらにはゲームなどのエンタテイメント分野での利用が見込まれています。

お問い合わせサイトマップ個人情報保護方針利用規約ENGLISHCHINESE