隣接文節間の係り受け情報に着目した話し言葉のチャンキングの評価
スポンサーリンク
概要
- 論文の詳細を見る
会議録作成支援や字幕付与などの音声言語処理を指向して、話し言葉を"適当な"単位に区分化することを考える。従来、話し言葉音声では、ポーズに基づいて発話単位を設定することが多いが、ポーズが文や節の境界と対応しない場合が多く、均質な言語的まとまりにならない。一方、話し言葉の節や文の境界を機械学習に基づいて検出する方法も研究されているが、音声認識結果に対してはF値が70%台であり、誤検出箇所に関して意味づけを見いだすのが難しい。これに対して本研究では、話し言葉の非定型性や音声認識誤りに頑健であると考えられる局所的な特徴、具体的には隣接文節間の係り受けに着目して、チャンキングを行う。述語判定や係り受けタイプ判定を組み合わせることにより、文の主題や述語・格要素におおむね対応する「構成要素」を抽出する。『日本語話し言葉コーパス』(CSJ)で分析・評価を行った結果、隣接文節間に絞ることで係り受け解析が高い精度でできること、構成要素に基づいて音声認識結果に対してもより頑健に節境界を検出できることが示された。
- 一般社団法人情報処理学会の論文
- 2006-05-11
著者
-
河原 達也
京都大学 情報学研究科
-
西光 雅弘
京都大学大学院情報学研究科,現在,日本電気株式会社共通基盤ソフトウェア研究所
-
西光 雅弘
京都大学 情報学研究科 知能情報学専攻
-
高梨 克也
京都大学 情報学研究科 知能情報学専攻
-
高梨 克也
科学技術振興機構さきがけ|京都大学
-
西光 雅弘
京都大学大学院情報学研究科 現在 日本電気株式会社共通基盤ソフトウェア研究所
-
河原 達也
京都大学 学術情報メディアセンター
関連論文
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(第8回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 特集「聞き手行動から見たコミュニケーション」の編集にあたって
- 音声対話による大規模知識ベース検索システム : 音声版ダイアログナビ(音・音声インタフェース)
- 話し言葉における引用節・挿入節の自動認定および係り受け解析への応用
- フレーズスポッティングと意味解析の密結合による頑健な音声言語理解
- 音声理解システムにおける制約緩和法の検討
- 会議音声の自動話題分割による単語辞書と言語モデルの適応(要約・分割)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- ポッドキャストを対象とした音リアクションイベント検出
- 文書検索型音声対話システムにおけるベイズリスクに基づく対話制御の最適化(セッション3 : 理解るインタフェース : 音声対話)
- 文書検索型音声対話システムにおけるベイズリスクに基づく対話制御の最適化(セッション3 : 理解るインタフェース : 音声対話)
- ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(第8回音声言語シンポジウム)
- ドメインとスタイルを考慮した Web テキストの選択による対話システム用言語モデルの構築
- ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(Session-7 システム,第8回音声言語シンポジウム)
- ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(Session-7 システム,第8回音声言語シンポジウム)
- ドメインとスタイルを考慮した Web テキストの選択による対話システム用言語モデルの構築
- 限定されたドメインにおける質問応答機能を備えた文書検索・提示型対話システム(検索・対話)
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- 点予測による形態素解析
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウェアの概要(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 合意形成型の多人数インタラクションにおける会話構造について(ワークショップ,言語・非言語コミュニケーション及び一般)
- 聞き手の興味・関心を示すあいづちの生起する会話文脈の分析
- 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
- ポスター会話におけるあいづちの韻律的特徴に関する印象評定
- ポスター会話におけるあいづちの形態的・韻律的な特徴分析と会話モード間との相関の分析
- ポスター会話における聞き手反応のマルチモーダルな分析
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- 隣接文節間の係り受け情報に着目した話し言葉のチャンキングの評価
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 視覚情報を話題の対象とする音声対話システム
- 視覚情報を話題の対象とする音声対話システム
- 2000-SLP-31-11 種々のタスクにおける大語彙連続音声認識システムの性能評価と診断
- VoiceXMLの動的生成に基づく自然言語音声対話システム
- VoiceXMLの動的生成に基づく自然言語音声対話システム
- 講義の自動アーカイブ化のための韻律情報を用いた講義音声の文境界の抽出
- 日本語モーラリズム習得支援システム : 調音法に基づいたリズムパターンテンプレートの設定
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出
- 対話研究に「意図」は必要か(意図研究のスペクトル)
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム
- 多人数合意形成会話における提案セグメントに応じた聞き手応答の変化の分析
- チュートリアルへの質問と回答(多人数インタラクションの分析方法〔第8回〕)
- 座談会:言語・非言語コミュニケーション研究からマルチモーダルコミュニケーション研究へ(多人数インタラクションの分析手法〔第7回〕)
- チュートリアル「多人数インタラクションの分析手法」第6回で取り上げる問題
- チュートリアル「多人数インタラクションの分析手法」 : 第5回で取り上げる問題
- チュートリアル「多人数インタラクションの分析手法」 : 第4回で取り上げる問題
- チュートリアル「多人数インタラクションの分析手法」第3回で取り上げる問題
- 多人数インタラクション研究の方法 : 言語・非言語コミュニケーション研究のための分析単位とその概念(多人数インタラクションの分析手法〔第2回〕)
- 多人数インタラクション研究には何が必要か? : インタラクション研究の国内外の動向と現状(多人数インタラクションの分析方法〔第1回〕)
- チュートリアル「多人数インタラクションの分析手法」連載開始にあたって
- ポスター会話における発話の情報構造と基盤化の分析
- 多人数インタラクション研究の理論的背景 : 言語・非言語コミュニケーション論の比較とその利用について(ワークショップ,言語・非言語コミュニケーション及び一般)
- 会話における合意形成と相互信頼感形成
- 会話・対話におけるまとまりに関する一考察
- 多人数会話における談話構造と視線配布パターンの関係について
- 音声言語を用いた仮想空間との対話による試着システム
- 大語彙連続音声認識を用いた落語のリアルタイム字幕付与(認識, 信頼度)
- 話題と話者に関するPLSAに基づく言語モデル適応(言語モデル・要約)(第5回音声言語シンポジウム)
- Web からの情報抽出を用いた音声対話システム
- 文書検索タスクにおける検索要求明確化のための対話戦略
- 音声対話理解のためのネットワーク上のMessage Passingに基づく部分文解析
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習(音声,聴覚)
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(言語モデル・要約)(第5回音声言語シンポジウム)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出(自然言語情報処理研究会と一部合同開催 : NL・SLP合同開催 : 音声対話1)
- 講演音声認識のための言語モデルの教師なし適応
- LPC残差のキュムラントとオンラインEMアルゴリズムに基づいた頑健な発話区間検出(認識・検出)
- 講演音声認識のための言語モデルの教師なし適応
- 対話コンテキストとトピッククラスタリングを用いたドメイン外発話の検出
- 述語項の類似度に基づく情報推薦を行う音声対話システム
- ウエーブレットに基づくウイナーフィルタを用いた雑音及び残響に頑健な音声認識
- 識別学習に基づく音声認識単語辞書の最適化
- 講演に対する読点の複数アノテーションに基づく自動挿入
- テキストと音声を用いた単語と読みの自動獲得
- 複数トピック分類の信頼度に基づくドメイン外発話の検出(システム・信頼度)(第5回音声言語シンポジウム)
- 複数トピック分類の信頼度に基づくドメイン外発話の検出
- right-to-leftパーザを用いた会話音声認識
- ポスター発表における質問者と質問の種類の推定のためのマルチモーダルな聞き手行動分析
- Web時代の音声・言語技術
- 多人数・マルチモーダルインタラクション研究のためのプラットフォーム構築
- 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム
- 音声会話コンテンツにおける聴衆の反応に基づく音響イベントとホットスポットの検出
- 聞き手行動研究の広がりと深まり : 「誌上討論」の編集にあたって
- BICに基づく話者モデル選択の教師なし話者インデキシングにおける評価
- 点予測による形態素解析
- 情報コンシェルジェ : Mind Probingに基づくマルチモーダルインタラクションシステム(「コミュニケーションと気づき」及び一般)
- 複合的言語制約に基づくキーフレーズスポッティングによる対話音声理解
- 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
- 保健指導対話を対象とした相互信頼感形成過程の分析 (一般セッションと「法と社会のインタフェース」関する特別セッション)
- ウエーブレットパケット分解による残響に頑健な音声認識
- 2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(システム・信頼度)(第5回音声言語シンポジウム)
- ポスター会話におけるパラ言語・非言語情報を用いた話者交替及び次話者の予測 (一般セッションと「法と社会のインタフェース」関する特別セッション)
- 話題の追跡 国会審議の会議録作成支援のための音声認識システム
- 知識伝達インタフェースとしての科学コミュニケーター:日本科学未来館におけるインタラクション行動分析
- 知識伝達インタフェースとしての科学コミュニケーター:日本科学未来館におけるインタラクション行動分析
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識