<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>PtoPAオフィシャルサイト &#187; 音声認識</title>
	<atom:link href="http://www.ptopa.com/tag/%e9%9f%b3%e5%a3%b0%e8%aa%8d%e8%ad%98/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.ptopa.com</link>
	<description>人工知能のテクノロジーを活かしコンピュータと会話</description>
	<lastBuildDate>Mon, 07 Jun 2010 01:00:15 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>ja</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>音声認識による自動会話を簡単に実現する「言語モデル自動生成技術」を開発</title>
		<link>http://www.ptopa.com/press/926/</link>
		<comments>http://www.ptopa.com/press/926/#comments</comments>
		<pubDate>Wed, 25 Apr 2007 09:25:31 +0000</pubDate>
		<dc:creator>sfujiwara</dc:creator>
				<category><![CDATA[プレスリリース]]></category>
		<category><![CDATA[コーパス]]></category>
		<category><![CDATA[ナレッジベース]]></category>
		<category><![CDATA[音声認識]]></category>

		<guid isPermaLink="false">/?p=926</guid>
		<description><![CDATA[株式会社ピートゥピーエー（略称：PtoPA、本社：東京都江東区有明3-1-25、社長：黄　声揚、自然言語によるAI自動会話システムの研究開発会社として平成12年7月7日に設立）は、平成19年4月25日、コンテンツ毎に特別 [...]]]></description>
			<content:encoded><![CDATA[<p>株式会社ピートゥピーエー（略称：PtoPA、本社：東京都江東区有明3-1-25、社長：黄　声揚、自然言語によるAI自動会話システムの研究開発会社として平成12年7月7日に設立）は、平成19年4月25日、コンテンツ毎に特別な言語モデルを作成しなくても、音声認識や音声自動会話が簡単に行える独自の「言語モデル自動生成技術」を開発したと発表いたしました。<span id="more-926"></span></p>
<p>従来の音声認識技術の常識では、音声認識や音声自動会話などのコンテンツ制作時に、コンテンツ内容に関連した膨大なコーパス（単語や文章などの大量の言語データ、言葉の集まり）を収集してそのコンテンツ専用の言語モデルを作成することが必要でした。例えば、ユーザからの電話による育児相談にコンピュータが音声で自動応答するようなコンテンツを考えてみましょう。育児悩み相談の会話を行う場合には、「フォローアップミルク」、「歯がため」、「夜泣き」など育児独特のコーパスが数多く使われます。発話された文章を認識する際に、こういった特有のコンテンツの中でよく使われるコーパスを、日常の会話で使われるコーパスより優先的に判定し、認識することで、精度の高い音声認識が可能となるのです。</p>
<p>しかし、このコーパスを多量に収集し、認識の優先度をつけて独自の言語モデルを作成する作業はどうしても手作業が中心となり、相当な専門知識と時間と費用が必要で、言語関係の専門会社に依頼せざるを得ませんでした。これは、音声認識関係コンテンツが世の中に多数普及するにあたっての大きな阻害要因となっていました。</p>
<p>PtoPAでは、このような手間をかけて言語モデルを特別に作成しなくても、音声自動会話のコンテンツ（会話シナリオのナレッジベース）から自動的にコーパスを抽出し、それぞれの言葉の優先順位を自動的に設定する「言語モデル自動生成技術」を開発いたしました。しかもこの「言語モデル自動生成技術」では、PtoPAが独自に開発した汎用辞書を利用して、同じ意味でも言い方が異なる多数の「言い回し」、例えば「通学する」と言う文章をナレッジベースに搭載すると、「登校する」などの関連文や関連語も自動的に言語モデルに生成することができるのです。実際に手作業で2～3ヶ月をかけて作成した言語モデルと自動生成した言語モデルを比較してみると、自動生成言語モデルは手作業の言語モデルの80％以上を常にカバーしている結果が得られています。</p>
<p>もちろんこの「言語モデル自動生成技術」は、音声自動会話コンテンツのみで利用できるのではなく、通常の音声認識コンテンツにおいても、不完全なフリーコーパスから精度の高い、そして「言い回し」の拡張性も付加された言語モデルを自動生成することができ、従来の音声認識分野でも大いに貢献いたします。</p>
<p>PtoPAでは、現在開発中の人とコンピュータの音声自動会話を実現する画期的な汎用プラットフォーム「VOICE　CAIWA」の中に、この「言語モデル自動生成技術」を組み込むことにいたしました。これにより、「VOICE　CAIWA」で音声自動会話コンテンツを作る際には、手間と費用をかけて特別な言語モデルを作成する必要は無くなりました。しかも、「VOICE　CAIWA」で使用するナレッジベースも極めて簡単に作成することができます。人とコンピュータが話すであろう会話文をまるでシナリオを書くように入力していくだけで、会話コンテンツが出来上がってしまいます。</p>
<p>PtoPAではこの「言語モデル自動生成技術」を搭載した「VOICE　CAIWA」を近々市場に提供していく予定です。この技術の登場が音声認識を初めとした様々な音声アプリケーションの実用化を促進し、電話を使った音声での自動FAQを始め、カーナビ、ロボット、動画や音声を融合させたインタラクティブ映像コンテンツや音声によるeラーニングシステム、さらにはゲームなど、ビジネスからエンタテイメントまで、幅広い分野での利用が見込まれています。</p>]]></content:encoded>
			<wfw:commentRss>http://www.ptopa.com/press/926/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>音声認識の精度を格段に向上させるPA技術の開発に成功</title>
		<link>http://www.ptopa.com/press/423/</link>
		<comments>http://www.ptopa.com/press/423/#comments</comments>
		<pubDate>Mon, 09 Apr 2007 04:25:15 +0000</pubDate>
		<dc:creator>sfujiwara</dc:creator>
				<category><![CDATA[プレスリリース]]></category>
		<category><![CDATA[ロボット]]></category>
		<category><![CDATA[音声認識]]></category>
		<category><![CDATA[韻律解析]]></category>

		<guid isPermaLink="false">/?p=423</guid>
		<description><![CDATA[株式会社ピートゥピーエー（略称：PtoPA、本社：東京都江東区有明3-1-25、社長：黄　声揚、自然言語によるAI自動]]></description>
			<content:encoded><![CDATA[<p>株式会社ピートゥピーエー（略称：PtoPA、本社：東京都江東区有明3-1-25、社長：黄　声揚、自然言語によるAI自動会話システムの研究開発会社として平成12年7月7日に設立）は、平成19年4月9日、雑音の多い環境でも<a href="/development/voice/">音声認識</a>が高い精度で行える独自の<a href="/development/voice/#panalyzer">「PA技術」</a>の開発に成功したことを発表いたしました。<span id="more-423"></span>PA：Prosody Analyzer（韻律解析システム）</p>
<p><a href="/development/voice/">音声認識</a>の結果は、周囲の雑音や話者の話し方によって大きな影響を受けます。このため、これまでの<a href="/development/voice/">音声認識技術</a>の開発は、雑音の無い環境でしかも正しく発話されると言う理想的な条件を設定して進められてきました。しかしながら、<a href="/development/voice/">音声認識</a>の実用化を目指してきた多くのエンジニアは、このような理想的な環境の中で開発されてきた<a href="/development/voice/">音声認識技術</a>が、現実の場面ではどこまで役に立つのだろうかと大きな疑問を抱えていました。特に<a href="/development/robot/">コミュニケーションロボット</a>のように、雑音の中で音声会話を行うような状況では大きな問題であったのです。また雑音問題以外にも、小さくささやくような声や怒鳴るような大声が認識できない、さらには電話などでの通信中のパケットロスによる音質劣化で認識不能になる等、認識ができなくなる要因が多々あり、<a href="/development/voice/">音声認識技術</a>の普及を阻んできました。<a href="/development/voice/">音声認識</a>の飛躍的な精度向上のためには、これら認識が不可能な話者音声や音質劣化を知的に検出し、話者に発声のしなおしをさせるような仕組みが必要とされていたのです。</p>
<p>PtoPAの<a href="/development/voice/#panalyzer">「PA技術」</a>はこの音声を細かく分析し、雑音データと音声データを高い精度で分離したり、認識が不可能となった音声をきちんと識別して発話のしなおしを話者に促すことのできる、音声分野の新しい技術です。このPA技術では、時間領域での音声波形特性に着目して、複数の会話がある中で自動会話をするべき主会話を見つけ出す技術や、大きい声や小さい声などの認識不能な音声を聞き分ける技術、物を落したり何かがぶつかったりして発生する突発音や舌打ちなどの口から発する雑音を聞き分けてカットする技術を実現しています。さらには、ナレッジベースに収められた会話シナリオを参照して発話音声を判定する技術の開発により、従来にない高精度な<a href="/development/voice/">音声認識</a>を達成いたしました。<br />
この<a href="/development/voice/#panalyzer">「PA技術」</a>の知的な検出機能と、話者とのコミュニケーションを通して音声認識率を高めていくテクノロジーが<a href="/development/voice/">音声認識</a>の飛躍的な進化へとつながったのです。今後は、高性能音声認識ソフト「Julius」を応用した<a href="/development/voice/">音声認識システム</a>や音声応答システムの精度を大幅に向上させ、様々な音声アプリケーションの実用化を促進いたします。</p>
<p>PtoPAではこれら音声認識をインテリジェント化した<a href="/development/voice/#panalyzer">「PA技術」</a>を、汎用音声会話プラットフォームとして近々発表予定の「VOICE CAIWA」に搭載していく意向です。今後は幅広いビジネス分野での応用も期待され、電話を使った音声での自動FAQを始め、カーナビ、<a href="/development/robot/">ロボット</a>、動画や音声を融合させたインタラクティブ映像コンテンツや音声によるeラーニングシステム、さらにはゲームなどのエンタテイメント分野での利用が見込まれています。</p>]]></content:encoded>
			<wfw:commentRss>http://www.ptopa.com/press/423/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
