音素片と文字列カーネルを用いた語彙制約のないトピック分割について
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,大語彙連続音声認識(LVCSR)を用いることなしに,入力音声を意味的に等質な部分に分割する手法を提案する.この手法は,音声を,音素よりも粒度の細かい音素片の列として認識した上で,文字列カーネルを用いて分析区間どうしの類似性を計算し,類似した分析区間を併合することで音声の構造化を行う.文字列カーネルは,与えられた2つの文字列に共通して含まれる任意の部分文字列の出現頻度に基づいて文字列の類似性を計算する.LVCSRとテキストのトピック分割を組合せた従来の方法が,単語の分布の類似性に基づいて音声の構造化を行うのに対して,提案手法は,音素片の部分列の分布の類似性に基づいて構造化を行う.LVCSRを用いないことにより,語彙や文法に制約されることがなく,タスクや分野に依存しない音声のトピック分割が可能になる.さらに,このようなトピック分割法は,ニュース音声コーパスを用いた実験において,従来法と比較して同等以上の性能を有していることが示される.
- 社団法人電子情報通信学会の論文
- 2006-05-19
著者
関連論文
- 語彙フリー音声文書検索手法における新しいサブワードモデルとサブワード音響距離の有効性の検証(音声言語)
- 三軸マイクロフォンアレイを用いた三次元ポインティング音声インタフェースの開発(福祉と音声処理,一般)
- 連続単語音声認識結果の読み系列を利用した辞書未登録語の音声文書検索(認識,理解,対話,一般)
- サブワードを用いた音声文書検索における複数サブワードの統合 : サブワード毎の検索語検索性能期待値の利用(認識,理解,対話,一般)
- 音声検索システムのための時間整合を考慮したサブワードモデル構築手法の検討(検索・対話)
- 語彙フリー音声検索におけるサブワードの検討および災害放送検索システムへの応用(要約, 検索, 認識・理解・対話・一般)
- 曲内の類似性を用いた曲境界の検出性能の向上
- Web上の語彙を利用した音声クエリ拡張による検索語検出 (言語理解とコミュニケーション)
- 共通中間音声符号系を用いた音声認識方式
- 語彙制限のない音声文書検索における複数サブワードの統合----検索語彙に依存した検索性能推定指標の導入
- 音声文書検索のための多言語音素片セグメントの応用(ポスターセッション)(第5回音声言語シンポジウム)
- 音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
- 音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
- 音声文書検索のための多言語音素片セグメントの応用
- 信頼度測定の音声データ検索システムへの応用
- 汎用音声符号系への符号化と音声処理システムの構築
- 言語に共通な音声符号系を用いた音声検索システム
- 言語に共通な音声符号系とその音響セグメントモデルの作成
- Web上の語彙を利用した音声クエリ拡張による検索語検出(音声検索・要約,第11回音声言語シンポジウム)
- Web上の語彙を利用した音声クエリ拡張による検索語検出(音声検索・要約,第11回音声言語シンポジウム)
- ユビキッキ : オフィス活動支援のための分散配置型ポータブルロボット(複合現実感,仮想都市,及び一般)
- 三軸マイクロフォンアレイを用いた三次元ポインティング音声インタフェースの開発(福祉と音声処理,一般)
- 音素上の文字列カーネルを用いた重度障害者の不明瞭音声コマンド認識(聴覚・音声・言語とその障害,一般)
- 音素上の文字列カーネルを用いた重度障害者の不明瞭音声コマンド認識
- HLAC尺度に依存した非定常信号処理 : 音素識別の性能評価(一般)
- 音素片と文字列カーネルを用いた語彙制約のないトピック分割について
- 音素片のカーネル主成分分析を用いたトピックセグメンテーション(セッション : 一般(知識処理), 「社会システムにおける知能」及び一般)
- 音素片のカーネル主成分分析を用いたトピックセグメンテーション
- 音素片のカーネル主成分分析を用いたトピックセグメンテーション(一般(知識処理), 「社会システムにおける知能」及び一般)
- セグメント単位の音声符号列からのレキシコンの生成
- 区分線形セグメントラティスによる日英混合音声の認識
- 言語混合単語音声認識に関する実験的検討
- 区分線形セグメントラティスにおける音韻的チャンクの抽出
- 中間符号系と記号列間距離計算に基づく音声処理の提案
- 区分線形セグメントラティス音韻モデルにおけるクラスタリング
- 単語セットの音声認識難易度推定 : 記号領域における単語間距離計算の応用
- 記号領域における単語間距離の計算と音声認識難易度
- 区分線形セグメント列からの音素的構造の抽出
- 音声スペクトルからの識別的特徴抽出に関する実験的検討
- 音韻モデル獲得のための区分線形セグメントラティスの学習
- 区分線形セグメントラティスを用いた単語モデルの自動生成
- MF143 表情筋および頸部の筋電位信号を利用した日本語母音の識別(MF14 情報・コミュニケーション支援,あたり前のことを知る)
- サポートベクターマシンを用いた筋電位信号からの日本語母音の識別(一般)
- ブール関数の学習におけるブーリアンカーネルを用いた特徴選択について(一般 : データマイニングII)
- ブール関数の学習におけるブーリアンカーネルを用いた特徴選択について(一般(データマイニングII))(「社会システムにおける知能」及び一般)
- 制限カーネルを用いた特徴選択(9月15日)(「アクティブマイニング」及び一般)
- 制限カーネルを用いた特徴選択(「アクティブマイニング」及び一般)
- Boolean Kernel Classifier : Support Vector Machineを用いたブール関数の帰納学習
- 頸部から計測した筋電位信号を利用した発話認識
- 「話せばわかる」は「あたり前」?("あたり前"について考えたこと-福祉工学シンポジウム2007実行委員寄稿集-,あたり前のことを知る)
- 「音声研究者電子メールアドレス帳」について
- 単語音声サンプルからの音韻概念の獲得
- 正弦波重畳方式による母音合成システムの音響教育への応用(音声・言語・音響教育,一般)
- 認知症者とロボットの対話のための相槌認識における話者依存性の分析と話者適応の効果について(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- 認知症者とロボットの対話のための相槌認識における話者依存性の分析と話者適応の効果について(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- 軽度認知症高齢者のための情報支援システムにおける不適格発話に頑健な談話行為識別 (一般セッションと「ワークショップにおける学びの共有化」に関する特別セッション)
- 音声中の検索語検出における事前検索・HMM状態系列照合・リランキングの適用
- 音節N-gramの事前検索結果を利用した音声中の検索語検出の高速化方式
- 音声中の検索語検出における音素トライグラム照合による高速抽出法(ポスターセッション)
- N.Cristianini and J.Shawe-Taylor:An Introduction to Support Vector Machines, Cambridge University Press(2000)
- 類似音節バイグラムリストを用いた音声中の検出語検出
- 類似音節バイグラムリストを用いた音声中の検出語検出