<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>PtoPAオフィシャルサイト &#187; コーパス</title>
	<atom:link href="http://www.ptopa.com/tag/%e3%82%b3%e3%83%bc%e3%83%91%e3%82%b9/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.ptopa.com</link>
	<description>人工知能のテクノロジーを活かしコンピュータと会話</description>
	<lastBuildDate>Wed, 01 Feb 2012 05:00:43 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>音声認識による自動会話を簡単に実現する「言語モデル自動生成技術」を開発</title>
		<link>http://www.ptopa.com/press/926/</link>
		<comments>http://www.ptopa.com/press/926/#comments</comments>
		<pubDate>Wed, 25 Apr 2007 09:25:31 +0000</pubDate>
		<dc:creator>PtoPA</dc:creator>
				<category><![CDATA[お知らせ]]></category>
		<category><![CDATA[コーパス]]></category>
		<category><![CDATA[ナレッジベース]]></category>
		<category><![CDATA[音声認識]]></category>

		<guid isPermaLink="false">/?p=926</guid>
		<description><![CDATA[株式会社ピートゥピーエー（略称：PtoPA、本社：東京都江東区有明3-1-25、社長：黄　声揚、自然言語によるAI自動会話システムの研究開発会社として平成12年7月7日に設立）は、平成19年4月25日、コンテンツ毎に特別 [...]]]></description>
			<content:encoded><![CDATA[<p>株式会社ピートゥピーエー（略称：PtoPA、本社：東京都江東区有明3-1-25、社長：黄　声揚、自然言語によるAI自動会話システムの研究開発会社として平成12年7月7日に設立）は、平成19年4月25日、コンテンツ毎に特別な言語モデルを作成しなくても、音声認識や音声自動会話が簡単に行える独自の「言語モデル自動生成技術」を開発したと発表いたしました。<span id="more-926"></span></p>
<p>従来の音声認識技術の常識では、音声認識や音声自動会話などのコンテンツ制作時に、コンテンツ内容に関連した膨大なコーパス（単語や文章などの大量の言語データ、言葉の集まり）を収集してそのコンテンツ専用の言語モデルを作成することが必要でした。例えば、ユーザからの電話による育児相談にコンピュータが音声で自動応答するようなコンテンツを考えてみましょう。育児悩み相談の会話を行う場合には、「フォローアップミルク」、「歯がため」、「夜泣き」など育児独特のコーパスが数多く使われます。発話された文章を認識する際に、こういった特有のコンテンツの中でよく使われるコーパスを、日常の会話で使われるコーパスより優先的に判定し、認識することで、精度の高い音声認識が可能となるのです。</p>
<p>しかし、このコーパスを多量に収集し、認識の優先度をつけて独自の言語モデルを作成する作業はどうしても手作業が中心となり、相当な専門知識と時間と費用が必要で、言語関係の専門会社に依頼せざるを得ませんでした。これは、音声認識関係コンテンツが世の中に多数普及するにあたっての大きな阻害要因となっていました。</p>
<p>PtoPAでは、このような手間をかけて言語モデルを特別に作成しなくても、音声自動会話のコンテンツ（会話シナリオのナレッジベース）から自動的にコーパスを抽出し、それぞれの言葉の優先順位を自動的に設定する「言語モデル自動生成技術」を開発いたしました。しかもこの「言語モデル自動生成技術」では、PtoPAが独自に開発した汎用辞書を利用して、同じ意味でも言い方が異なる多数の「言い回し」、例えば「通学する」と言う文章をナレッジベースに搭載すると、「登校する」などの関連文や関連語も自動的に言語モデルに生成することができるのです。実際に手作業で2～3ヶ月をかけて作成した言語モデルと自動生成した言語モデルを比較してみると、自動生成言語モデルは手作業の言語モデルの80％以上を常にカバーしている結果が得られています。</p>
<p>もちろんこの「言語モデル自動生成技術」は、音声自動会話コンテンツのみで利用できるのではなく、通常の音声認識コンテンツにおいても、不完全なフリーコーパスから精度の高い、そして「言い回し」の拡張性も付加された言語モデルを自動生成することができ、従来の音声認識分野でも大いに貢献いたします。</p>
<p>PtoPAでは、現在開発中の人とコンピュータの音声自動会話を実現する画期的な汎用プラットフォーム「VOICE　CAIWA」の中に、この「言語モデル自動生成技術」を組み込むことにいたしました。これにより、「VOICE　CAIWA」で音声自動会話コンテンツを作る際には、手間と費用をかけて特別な言語モデルを作成する必要は無くなりました。しかも、「VOICE　CAIWA」で使用するナレッジベースも極めて簡単に作成することができます。人とコンピュータが話すであろう会話文をまるでシナリオを書くように入力していくだけで、会話コンテンツが出来上がってしまいます。</p>
<p>PtoPAではこの「言語モデル自動生成技術」を搭載した「VOICE　CAIWA」を近々市場に提供していく予定です。この技術の登場が音声認識を初めとした様々な音声アプリケーションの実用化を促進し、電話を使った音声での自動FAQを始め、カーナビ、ロボット、動画や音声を融合させたインタラクティブ映像コンテンツや音声によるeラーニングシステム、さらにはゲームなど、ビジネスからエンタテイメントまで、幅広い分野での利用が見込まれています。</p>]]></content:encoded>
			<wfw:commentRss>http://www.ptopa.com/press/926/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

