カテゴリー:お知らせ
2007/4/25
株式会社ピートゥピーエー(略称:PtoPA、本社:東京都江東区有明3-1-25、社長:黄 声揚、自然言語によるAI自動会話システムの研究開発会社として平成12年7月7日に設立)は、平成19年4月25日、コンテンツ毎に特別な言語モデルを作成しなくても、音声認識や音声自動会話が簡単に行える独自の「言語モデル自動生成技術」を開発したと発表いたしました。
従来の音声認識技術の常識では、音声認識や音声自動会話などのコンテンツ制作時に、コンテンツ内容に関連した膨大なコーパス(単語や文章などの大量の言語データ、言葉の集まり)を収集してそのコンテンツ専用の言語モデルを作成することが必要でした。例えば、ユーザからの電話による育児相談にコンピュータが音声で自動応答するようなコンテンツを考えてみましょう。育児悩み相談の会話を行う場合には、「フォローアップミルク」、「歯がため」、「夜泣き」など育児独特のコーパスが数多く使われます。発話された文章を認識する際に、こういった特有のコンテンツの中でよく使われるコーパスを、日常の会話で使われるコーパスより優先的に判定し、認識することで、精度の高い音声認識が可能となるのです。
しかし、このコーパスを多量に収集し、認識の優先度をつけて独自の言語モデルを作成する作業はどうしても手作業が中心となり、相当な専門知識と時間と費用が必要で、言語関係の専門会社に依頼せざるを得ませんでした。これは、音声認識関係コンテンツが世の中に多数普及するにあたっての大きな阻害要因となっていました。
PtoPAでは、このような手間をかけて言語モデルを特別に作成しなくても、音声自動会話のコンテンツ(会話シナリオのナレッジベース)から自動的にコーパスを抽出し、それぞれの言葉の優先順位を自動的に設定する「言語モデル自動生成技術」を開発いたしました。しかもこの「言語モデル自動生成技術」では、PtoPAが独自に開発した汎用辞書を利用して、同じ意味でも言い方が異なる多数の「言い回し」、例えば「通学する」と言う文章をナレッジベースに搭載すると、「登校する」などの関連文や関連語も自動的に言語モデルに生成することができるのです。実際に手作業で2~3ヶ月をかけて作成した言語モデルと自動生成した言語モデルを比較してみると、自動生成言語モデルは手作業の言語モデルの80%以上を常にカバーしている結果が得られています。
もちろんこの「言語モデル自動生成技術」は、音声自動会話コンテンツのみで利用できるのではなく、通常の音声認識コンテンツにおいても、不完全なフリーコーパスから精度の高い、そして「言い回し」の拡張性も付加された言語モデルを自動生成することができ、従来の音声認識分野でも大いに貢献いたします。
PtoPAでは、現在開発中の人とコンピュータの音声自動会話を実現する画期的な汎用プラットフォーム「VOICE CAIWA」の中に、この「言語モデル自動生成技術」を組み込むことにいたしました。これにより、「VOICE CAIWA」で音声自動会話コンテンツを作る際には、手間と費用をかけて特別な言語モデルを作成する必要は無くなりました。しかも、「VOICE CAIWA」で使用するナレッジベースも極めて簡単に作成することができます。人とコンピュータが話すであろう会話文をまるでシナリオを書くように入力していくだけで、会話コンテンツが出来上がってしまいます。
PtoPAではこの「言語モデル自動生成技術」を搭載した「VOICE CAIWA」を近々市場に提供していく予定です。この技術の登場が音声認識を初めとした様々な音声アプリケーションの実用化を促進し、電話を使った音声での自動FAQを始め、カーナビ、ロボット、動画や音声を融合させたインタラクティブ映像コンテンツや音声によるeラーニングシステム、さらにはゲームなど、ビジネスからエンタテイメントまで、幅広い分野での利用が見込まれています。

