文クラスタ混合分布N-gramの検討
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, 十分な学習データ量が確保できない場合のN-gramモデルの構築法として, 本レベルの混合分布N-gramと類似タスクのデータを加えて学習する方法を組み合わせた手法を提案する.本手法は, ターゲットトピックのデータと類似タスクのデータを足しあわせて文をクラスタリングし, 各クラスタのN-gramから混合分布N-gramを構成するステップと, ターゲットトピックのデータだけを用いて混合分布N-gramの混合比を学習するステップからなる.本手法のメリットは, 類似タスクを用いた学習データ量の確保と, N-gramの混合比の学習による不要な学習データの除去にある.実験の結果, 提案法はターゲットトピックのデータだけから学習したtrigramよりもクロスエントロピーが低下することが確認された.
- 一般社団法人情報処理学会の論文
- 1998-12-10
著者
-
樋口 宜男
KDD研究所
-
清水 徹
(株)KDDI研究所
-
清水 徹
情報通信研究機構:atr音声言語コミュニケーション研究所
-
黒岩 眞吾
(株)KDD研究所
-
樋口 宜男
(株)KDD研究所
-
黒岩 真吾
国際電電 研
-
黒岩 眞吾
徳島大学大学院ソシオテクノサイエンス研究部:独立行政法人情報通信研究機構知識創成コミュニケーション研究センター音声言語グループ
-
大野 晃生
オーエスアイ・プラス
-
清水 徹
知識創成コミュニケーション研究セ
-
大野 晃生
(株)KDD研究所
関連論文
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
- 実用会話システムにおける対話型案内コンテンツの構築
- 実用会話システムにおける対話型案内コンテンツの構築(対話)
- サ変名詞を含む複合名詞のアスペクト演算に関する一考察
- 音声翻訳研究20年の夜明け : 受賞業績 携帯電話によるネットワーク型コーパスベース音声翻訳システムの構築(平成19年度喜安記念業績賞紹介)
- 2D-5 多言語音声翻訳基盤の通信インタフェースの検討と構築(音声対話・翻訳,一般セッション,人工知能と認知科学)
- B-7-90 VoIPサービス向け通話品質評価手法
- 雑音の特徴分析に向けた実環境雑音データベースの構築
- ATR実環境雑音DB-ATRANS-を用いた雑音重畳音声認識実験(耐雑音)
- L-1 IPベースの回線多重化転送方式におけるQoS情報通知手法(インターネットQoS制御,L.インターネット)
- 2 ここまできた音声翻訳技術(多言語自動通訳技術の実現に向けて)
- コミュニケーション効率に基づく音声翻訳システムの評価(異文化コラボレーション論文)
- 多言語音声コミュニケーションプラットホームと音声翻訳への応用(第8回音声言語シンポジウム)
- コミュニケーション効率に基づく課題遂行型音声対話の評価(第8回音声言語シンポジウム)
- 多言語音声コミュニケーションプラットホームと音声翻訳への応用(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- コミュニケーション効率に基づく課題遂行型音声対話の評価(Session-3 コミュニケーション・対話,第8回音声言語シンポジウム)
- 課題遂行型対話実験による日英及び日中音声翻訳システムの評価
- 音声翻訳研究の展開(機械翻訳)
- 翻訳可能なフレーズを単位とした音声認識結果の信頼度評価
- 波形素片接続型音声合成システムの検討
- ユーザの意図抽出結果に基づくテキスト生成
- 携帯電話音声に含まれる雑音のモデル化による音声区間検出誤りの削減
- 混合分布HMMにおけるTree-basedクラスタリング(音声情報処理 : 現状と将来技術論文特集)
- D-14-9 電話音声認識を用いた株価情報案内システム
- SP2000-10 多数話者電話音声データベースを用いた話者クラスタリング
- 大語彙汎用音声認識エンジンの評価
- 大語彙汎用音声認識エンジンの開発
- 多数話者電話音声データベースを用いた話者クラスタリングの検討
- 不特定話者混合分布HMMにおけるTree-Basedクラスタリングの検討
- 不特定話者混合分布HMMにおけるTree-Basedクラスタリングの検討
- 不特定話者混合分布HMMにおけるTree-Basedクラスタリングの検討
- 音声信号の途切れ・オーバーフローへのMissing Feature Theoryの適用
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験
- 特徴ベクトル間の交角を用いた話者照合方式
- ホームカントリーダイレクトサービスのための悪戯呼排除システムの評価
- ホームカントリーダイレクトサービスのための悪戯呼排除システム
- ホームカントリーダイレクトサービスのための悪戯呼排除システム
- 正しい構文解析木による禁止パターンの学習
- 電子メールを利用した機械翻訳システム
- テキスト指定型話者照合におけるしきい値設定法(音声情報処理 : 現状と将来技術論文特集)
- 連続数字認識を利用した悪戯電話排除システム
- 音声認識のためのCS-ACELP符号の音響パラメータ変換方式
- 高齢者用HMMによる認識実験
- 話者モデル学習時の尤度上昇幅を用いた話者識別手法
- 話者モデル学習時の尤度上昇幅を用いた話者照合閾値設定法
- 複数N-gramの利用による音声認識性能改善効果
- 不特定話者混合分布HMMにおけるTree-Basedクラスタリングの検討
- 話者モデル学習時の尤度上昇幅を用いた話者照合閾値設定法
- 符号化音声認識のための合成音声を用いた不特定話者音響モデルの適応法(音声,聴覚)
- Super-Functionを用いた日英機械翻訳における日付・時間表現の抽出
- N-gram出現頻度を用いた感情類似度計算
- 感情コーパス構築のための文中の語に基く感情分類手法
- Super-Functionを用いた日英機械翻訳における日付・時間表現の抽出(用語・情報抽出)
- N-gram出現頻度を用いた感情類似度計算(感情・評価)
- 感情コーパス構築のための文中の語に基く感情分類手法(感情・評価)
- データベースへの知的検索インターフェイスのための基礎実験
- 知識の更新と忘却機構に関する検討
- 事例に基づく定性的知識から定量的知識への変換手法の検討
- スペクトルの微細構造を考慮した風雑音除去手法(電気音響,音響一般)
- ガバナ間の共起関係学習のための基礎実験
- 音声認識を用いたホームカントリーダイレクト向けいたずら電話自動排除システム
- 多言語音声コミュニケーションプラットホームと音声翻訳への応用(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 多言語音声コミュニケーションプラットホームと音声翻訳への応用
- 最ゆう状態系列を用いた実時間ケプストラム平均値正規化の検討
- リジェクションを用いた音声始端検出法の改良
- 電話音声認識におけるケプストラム平均値算出法の改良
- 最尤状態系列を用いた実時間ケプストラム平均値正規化の検討
- 時差・エリアコード案内システムの試作
- 発声内容を考慮した実時間ケプストラム平均値正規化の検討
- コミュニケーション効率に基づく課題遂行型音声対話の評価(Session-3 コミュニケーション・対話,第8回音声言語シンポジウム)
- コミュニケーション効率に基づく課題遂行型音声対話の評価
- 話者照合におけるVQ歪みを用いたDP距離正規化法
- シミュレーテッドアニーリシグを用いた定量的知識から定性的知識への写像関数の最適化
- 時系列データを定性的に記述するための区間解釈法の検討
- トピックス20 Speak & SpellとDECtalk(〈特集〉-音響学における20世紀の成果と21世紀に残された課題-)
- 連続数字認識における低認識率話者の分析
- ボイスダイヤリングシステムの実装とフィ-ルド試験
- 実時間網管理への定性的診断知識の適用手法
- 数字を用いた話者照合方式の検討
- 数字を用いた話者照合方式の検討
- 数字を用いた話者照合方式の検討
- 文のクラスタリングに基づく統計的言語モデル
- 文クラスタ混合分布N-gramの検討
- 文クラスタ混合分布N-gramの検討
- 文クラスタ混合分布N-gramの検討
- パラメ-タ導出型日本語音声規則合成装置の評価 (新しい音声処理技術特集)
- テキスト編集機能付き音声規則合成装置の試作
- ワ-プロ機能付き音声規則合成装置--パソコント-ク
- 基本周波数及び音素持続時間を考慮した音声合成用波形素片データセットの作成
- 隣接単語間の結合関係に着目したテキスト音声変換用形態素解析処理
- 音声器官の動きに着目した音素持続時間の制御
- ボイスダイヤリングシステムの現状 (コンピュータと通信)
- 電話網経由の連続数字音声の認識実験
- 電話網経由で収集した数字音声の認識実験
- 電話網経由の連続数字音声の認識実験
- 日本語文章音声の合成のための無声化規則
- 第2回音声対話技術の通信への応用に関する国際ワークショップ(IVTTA 94)
- 隣接音素の統計的性質に基づくホルマント型音声合成方式
- テキスト編集機能付き日本語音声規則合成装置における韻律制御
- パラメータ導出型日本語音声規則合成方式における調音制御