ATRの新音声言語データベース
スポンサーリンク
概要
- 論文の詳細を見る
従来、計算機による自然言語処理を行なう場合, それに用いる知識は内省に頼っていた. しかし, 内省には揺れがあり, また定量的な分析ができないという欠点があった. 大規模な言語データが存在すれば, そこから客観的で定量的な知識を獲得することが可能である. 近年, 用例主導翻訳や確率文法の有用性が認知されるようになって, 言語データベースの必要性がますます叫ばれるようになってきている. しかし, 英語に関してはBrownコーパスなどが存在しているが, 日本語に関するものがほとんどないのが現状である. 一方, 音声処理の方は, 言語処理が記号処理的側面が強いのに対し, 本質的に信号処理であることから昔からデータの重要性は認識されていた. しかし、音声データベースが簡単に手に入れられるようになったのは最近のことである. 海外でも音声や言語のデータベースの重要性が高まり, 米国のLDC(Linguistic Data Consortium)などがデータベースの普及のために活発に活動を行なっている. ATR自動翻訳電話研究所(当所の前身)は音声データベースと言語データベースをそれぞれ別個に構築していた. これは外部にも販売されることで広く音声処理と言語処理の研究に利用されている. しかし, 前述の音声データベースは単語発声や文節発声のものがほとんどで文発声を対象としたい研究者にとっては不満なものであった. 一方, 言語データベースの方は自然発話を対象としているため近未来の音声認識システムを目標に置く研究者にとっては手に余るものであった. 自然発話を対象とする時には, 音声認識においては言語的な知識を用いなければ高い精度が得られないこは明白である. また, 言語の解析・翻訳においても音声情報は曖昧性解消のために重要である. そこで, これらの問題を解消するため, 我々は音声データと言語データを関連付けて一貫して管理する音声言語データベースを構築することにした. 本稿ではこの音声言語データベースの概要を報告する.
- 一般社団法人情報処理学会の論文
- 1994-03-07
著者
-
浦谷 則好
NHK放送技術研究所
-
匂坂 芳典
Atr音声言語コミュニケーション研究所:(現)早稲田大学大学院
-
森元 逞
ATR音声翻訳通信研究所
-
田代 敏久
マイクロソフト
-
竹沢 寿幸
ATR音声翻訳通信研究所
-
浦谷 則好
ATR音声翻訳通信研究所
-
田代 敏久
ATR音声翻訳通信研究所
関連論文
- 部分文字列への最適な分割と文脈を考慮した変換による翻字処理(自然言語処理)
- K-074 知識を統合しユーザの疑問に答えるTVエージェント(K分野:ヒューマンコミュニケーション&インタラクション)
- B-024 番組情報獲得システムにおけるラッパエージェント構築法(B.ソフトウェア)
- 未知固有表現を含む音声の認識([特別セッション]音声言語獲得・学習技術(2), 未知語処理)
- 複数のマルコフモデルを用いた階層化言語モデルによる未登録語認識(音声、聴覚)
- 話題と文型の違いを同時に考慮した言語モデル適応
- 対話者の前発話を利用した統計的言語モデル
- サブワードネットワークに基づく未登録語処理を搭載したデコーダの構築
- 大語彙連続音声認識における未知語のsub-wordモデリング手法
- インタラクティブ・システムにおける状況的な行為とその協調計算 (音声言語情報処理)
- テレビ受信ナビシステムにおける番組選択用リモコンに関する評価実験 : 様々な視聴者が視たい番組を簡単に選択受信できるテレビを目指して(映像メディア処理,感性情報工学及び一般)
- 日本人英語学習者音声の時間制御特性客観評価(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 2チャネル音声集音系における楕円積分を乗算係数に用いたスペクトル減算法(音声, 聴覚)
- 視線情報を利用した番組選択インタフェースの開発(セッション5 : マルチモーダルデザイン(2))
- K-074 視線情報を利用したテレビ用ユーザインタフェースの開発(K.ヒューマンコミュニケーション&インタラクション)
- 高齢者におけるデータ放送コンテンツのユーザーインターフェース評価 : 2種類のリモコンを比較して
- 7-4 高齢者によるデータ放送コンテンツのユーザーインターフェース評価
- プロトコル分析を用いたデータ放送コンテンツのユーザーインターフェース評価
- プロトコル分析を用いたデータ放送コンテンツのユーザーインターフェース評価
- ニューラルネットワークと言語統計量に基づく発音辞書の自動生成
- 大語彙連続音声認識における未知語のsub-wordモデリング手法
- 話し言葉の日英翻訳システムの評価法
- World Wide Webを用いた外国人名の英訳自動獲得(自然言語)
- 翻訳用例提示システムの設計・開発・運用
- オブジェクト連動データ放送システムに適したユーザインターフェースの開発とその評価実験
- オブジェクト連動データ放送システムに適したユーザインターフェースの開発とその評価実験(放送・サービス, ITS画像処理, 映像メディア及び一般)
- オブジェクト連動データ放送システムに適したユーザインターフェースの開発とその評価実験(放送・サービス, ITS画像処理, 映像メディア及び一般)
- 指さしポインターの開発とその性能評価実験
- 指さしポインターの開発とその性能評価実験(画像技術・視覚・その他一般)
- 局所的句構造に基づくF_0制御
- 音声翻訳システム : ATR-MATRIXの開発と評価(音声言語情報処理とその応用)
- ATR-MATRIXと人間との音声翻訳能力比較法の誤差に関する検討
- 日英音声翻訳システム ATR MATRIX
- ATRの新音声言語データベース
- 中国語単語音声からの基本周波数制御コマンドの自動抽出
- 複数話者の音声データベースから自動生成されたF_0制御規則の分析
- 臨界制動モデルパラメータの分布特性を用いたフレーズ境界の自動推定のための尺度の検討
- 統計的手法を用いた基本周波数パタン制御指令の自動分類
- 日英放送原稿翻訳者のための類似用例提示型翻訳支援システム
- D-14-11 日本人学習者に見られる中国語声調制御難易度の分析(D-14. 音声,一般セッション)
- 対話音声を対象とした連続音声認識システムの試作と評価
- 旅行会話タスクにおけるTARSPRECの性能評価
- ニュース音声認識のための(n≥4)-gramを併用する言語モデル
- リカレントニューラルネットワークを用いたセグメント境界推定
- 携帯電話型音声翻訳システムATR-MATRIX
- クライアント・サーバ型ATR-MATRIX
- 日英音声翻訳システムATR-MATRIXにおける音声認識用音響・言語モデル
- 異種言語知識の併用による文法的単語グラフ生成法
- 異種言語知識の併用による局所的信頼性向上
- 異種言語知識の併用による局所的信頼性向上
- 異種言語知識の併用による局所的信頼性向上
- 異種言語知識の併用による局所的信頼性向上
- MCE/GPDを用いた自然発話音声認識における不特定話者音響モデルの改善
- 音声翻訳実験システム(ASURA)のシステム構成と性能評価
- ユーザモデルエージェントによる番組選択システム
- 8-3 ニュース原稿のクラスタリングを用いたトピック抽出
- 発話情報を用いたF0制御パラメータの自動推定
- 人にやさしい放送と自然言語処理
- 放送ニュース文を対象とした効果的類似用例検索法
- 衛星放送用機械翻訳の辞書の改修 (慣用表現を中心に)
- 日英ニュース原稿の対訳コーパス化に関する基礎調査
- AP電経済ニュースからの定型パターンの抽出
- 音声合成のための規則とデータの表現, 獲得, 評価(音声情報処理 : 現状と将来技術論文特集)
- デジタル放送受信機用ユーザ・インタフェースの試作と評価(ヒューマンインタフェース基礎,インタラクション技術の原理と応用)
- デジタル放送用受信機の少ボタン型ユーザ・インタフェースの試作と評価
- パーソナル化するTV受信ナビシステムの開発
- パーソナルTVナビシステムの開発と評価結果
- パーソナルTVナビシステムの開発と評価結果(画像符号化・通信・ストリーム技術,及び一般)
- パーソナルTVナビシステムの開発と評価結果(画像符号化・通信・ストリーム技術,及び一般)
- 視聴態様に適合するテレビ受信ナビシステムの開発(映像メディア処理,感性情報工学及び一般)
- 番組推奨を含むテレビ受信ナビシステムの開発と主観評価結果(ハイビジョンおよび一般)
- 大語い連続音声認識のための単語仮説数削減
- Delayed decisionビーム探索の検討
- 単語グラフと可変長N-gramを用いた大語彙自然発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた連続音声認識法
- 地域や年齢的な広がりを考慮した大規模な日本語音声データベース
- 3-1 多様な視聴者にやさしい高度放送受信ナビゲーションシステムの検討課題
- 基本周波数パタンに見られる発話態度の分析(対話)
- 基本周波数パタンに見られる発話態度の分析(対話)
- 文中の音韻長伸縮の自然性許容に対する発話速度の効果(聴覚・音声・言語とその障害)
- K-075 頭部の自由な動きを許容する視線測定システム(K.ヒューマンコミュニケーション&インタラクション)
- 研究開発中の情報バリアフリー技術(人にやさしい放送,人にやさしい映像情報メディア)
- 衛星放送ワールドニュースの英日機械翻訳
- 形態素調整規則の半自動的獲得手法
- 英語ニュースデータベースの構築
- 英日機械翻訳における固有名詞処理
- 英語ニュース文におけるハイフンを含む語の局所解析
- 日本語ニュース文の表現パターンの分析
- 音声翻訳システムASURAの開発
- 後置詞句における助詞の実現と非実現の比較分析
- 放送用静止画検索システムFORKS
- 検索システムFORKSの操作性改善
- 結合価パターンを用いた : 深層格抽出法の一検討
- 12-7 オントロジを利用した番組関連情報獲得手法(第12部門 映像検索)
- 6-1 Q&Aシステムのための野球オントロジーの設計に関する検討(第6部門 インターフェース,画像・動画処理,その他)
- 20-6 番組選択行動における視線と興味の関係(第20部門 視覚の心理・生理)
- ニュース原稿データベースからの表現パターンの抽出
- 2次元パターン高速探索アルゴリズム