関連語彙獲得に基づく認識辞書のオフライン教師なし適応(音声・音響処理)
スポンサーリンク
概要
- 論文の詳細を見る
音声認識では認識辞書に含まれない単語は認識できないという、いわゆる未登縁語の問題があるが、認識結果の内容に関連する語彙を獲得して認識辞書に追加することにより入力音声に適応した未登縁語の少ない辞書を作成することができ、その辞書を用いて再度認識を行うことにより未登録語の影響を抑えて認識精度を改善できると考えられる。そこで本稿では、音声認識結果の内容に関連する語彙をコーパスから獲得し、獲得した語彙を辞書に追加することによって辞書を入力音声に適応させる手法を提案する。提案手法は、テキストコーパス中の語彙に対して語彙の分野を表す語彙分野ベクトルを算出しておき、入力の認識結果に対して発声内容の分野を推定し、その分野に近い語彙分野ベクトルを持つ語彙を入力に対する関連語彙として獲得し辞書に追加するという処理をオフラインで行う教師なし適応手法である。毎日新聞コーパスから各語彙の語彙分野ベクトルを求め、TVニュース音声を用いて提案手法の評価を行った。
- 一般社団法人情報処理学会の論文
- 2004-07-16
著者
-
林 良彦
大阪大学大学院言語文化研究科
-
廣嶋 伸章
NTTレゾナント株式会社
-
廣嶋 伸章
日本電信電話株式会社 NTTサイバーソリューション研究所
-
大附 克年
日本電信電話株式会社NTTサイバースペース研究所
-
大附 克年
早大・理工
-
大附 克年
マイクロソフトディベロップメント株式会社
関連論文
- 言語的オントロジーの構築と展開(オントロジーの進化と普及(前編))
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- 話題構造抽出に基づく会議音声インデクシングシステム(音声,聴覚)
- 目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価
- マルチファセット型ブログ検索システムBLOGRANGERの開発(オフィスインフォメーションシステム及び一般)
- 言語的オントロジーの構築と展開
- A-14-6 3人会話における非言語情報と「場の活性度」との相関の調査(A-14.ヒューマンコミュニケーション基礎,一般セッション)
- D-5-13 日本語係り受け構造の標準形式の検討(D-5.言語理解とコミュニケーション,一般セッション)
- 機械翻訳を介したコミュニケーションにおける利用者の機械翻訳システム適応の言語依存性
- 概念ベースに基づくWeb検索のクエリタイプ判定手法とその評価
- テキスト選択に基づくタスク依存言語モデル構築の検討
- 大規模データベースを用いたタスク依存言語モデル構築の検討
- 複数回会話における会話特徴の変遷 : 2人会話がその後に行う3人会話に与える影響(コミュニケーション支援,一般)
- 複数回会話における会話特徴の変遷 : 2人会話がその後に行う3人会話に与える影響(コミュニケーション支援,一般)
- 3人会話における非言語情報と「場の活性度」に関する検討(一般,「コミュニケーション研究の今,その先」及び一般)
- 2人会話における非言語手ががりと関係開始スキルについての研究(2)(一般,「コミュニケーション研究の今,その先」及び一般)
- 2人会話における非言語手ががりと関係開始スキルについての研究(1)(一般,「コミュニケーション研究の今,その先」及び一般)
- CTI向け自由発話対応音声対話システムRexDialog
- 評判検索におけるクエリ依存型の評価極性付与(意見・評判情報処理)
- ブログ記事からの意見文検索(意見・評判情報処理)
- 評判検索におけるクエリ依存型の評価極性付与
- Web ページのヘッドライン生成のための統計的要約
- 関連語彙獲得に基づく認識辞書のオフライン教師なし適応(音声・音響処理)
- 関連語彙獲得に基づく認識辞書のオフライン教師なし適応(音声・音響処理)
- D-14-11 音声認識結果の単語系列の言語的妥当性に基づく正誤判定(D-14. 音声・聴覚)
- 話題構造抽出に基づく会議音声インデクシング
- 統計的手法に基づくWebページからのヘッドライン生成
- 対話における共感状態の音声情報からの推定(言語コミュニケーションとそのフィールド)
- D-5-12 オントロジーに基づく言語サービス体系の検討(D-5.言語理解とコミュニケーション,一般セッション)
- 対話における共感状態の音声分析(一般,「コミュニケーション研究の今,その先」及び一般)
- 音素認識誤り傾向の統計的分析法に関する一考察
- N-best候補を用いた話題抽出の検討
- ニュース音声を対象とした連続音声認識に基づく話題抽出
- ニュース音声を対象とした大語彙連続音声認識と話題抽出
- ニュース音声を対象とした大語彙連続音声認識
- 高次n-gramを用いた大語彙連続音声認識の検討
- 新聞記事データベースを用いた大語い連続音声認識
- 単語trigramを用いた大語彙連続音声認識
- 単語trigramを用いた大語彙連続音声認識
- 新聞記事読み上げタスクを用いた大語彙連続音声認識における音響モデルの検討
- 新聞読み上げタスクを用いた大語彙連続音声認識における言語モデルの検討
- 新聞記事を用いた大語彙連続音声認識の検討
- 大語彙連続音声認識を用いた音声・映像コンテンツのインデクシング
- 音声認識・言語処理の適用によるコンテンツ内容記述メタデータの生成 (特集 メタデータ応用サービスおよび関連技術の動向)
- 2D-6 対話における共感状態の分析(音声・音楽情報処理,一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 言諸資源に関する国際標準とオントロジーに基づく言語サービスの検討(言語グリッドと異文化コラボレーション)
- ニュース音声認識のための言語モデルと音響モデルの検討
- ニュース音声認識のための言語モデルと音響モデルの検討
- ニュース音声認識のための言語モデルと音響モデルの検討
- RJ-002 自由対話における発話の共感状態の音声分析(J分野:ヒューマンコミュニケーション&インタラクション,査読付き論文)
- 書き起こし想定発話の音声認識における言語モデルの検討
- 時間非同期ビーム探索に基づく第二パスを用いた連続音声確認(音声処理技術のデモの紹介)
- 音声表記・音韻表記に基づく効率的で使い易いシンハラ語入力方式(インタフェースと応用)
- 統計的音韻中心の推定とそのHMMによる評価
- 統計的音韻中心における音韻の特徴分析
- D-14-19 ニュースコンテンツにおける音響信号自動判別の検討
- F-4 概念ベクトルによるトピックセグメンテーションのニュース音声への適用(音声・音声言語情報処理,F.音声・音楽)
- ニュース音声認識の話者適応法の検討
- ニュース音声認識における言語モデルの改良
- 音声認識エンジンVoiceRexを用いたリハビリ所見入力用音声ワープロ
- 音声認識エンジンVoiceRexによるニュース放送音声認識
- 音声認識エンジンVoiceRexによる文書作成--連続音声認識機能を用いた音声ワープロ (特集 ここまできた音声認識・音声合成)
- 適応音響モデルを用いた放送ニュース音声認識
- 新聞記事を用いた大語彙連続音声認識の検討
- マルチメディア時代を支える音声認識技術 (特集論文 メディア処理技術)
- 音声認識エンジンVoiceRexの開発
- 音声認識エンジンVoiceRexを開発--幅広い応用に対応できる音声認識ソフトウェア (特集 ここまできた音声認識・音声合成)
- 電子メールにおける重要文抽出と携帯電話向け要約システムへの適用(コンテンツ処理)
- D-5-5 RESTアーキテクチャによる言語資源のWebサービス化の検討(D-5.言語理解とコミュニケーション,一般セッション)
- 再利用・相互運用可能な言語資源の記述とモデル化の枠組み(異文化コラボレーション論文)
- セマンティックWebと言語資源・言語技術
- 漢字の自律学習のための読み誤りの自動生成(言語の学習・教育)
- 漢字の自律学習のための読み誤りの自動生成
- D-5-6 日本語解析の標準化へ向けた機能表現辞書の適用性(D-5.言語理解とコミュニケーション,一般セッション)
- 言語資源に関する国際標準とオントロジーに基づく言語サービスの検討
- 協調的な言語サービス基盤上における複合辞書アクセスサービスの検討(言語グリッドと異文化コラボレーション)
- D-8-15 辞書アクセスWebサービスにおけるルールに基づくHTMLの動的生成(D-8.人工知能と知識処理,一般セッション)
- D-5-8 標準的な言語解析機能のオントロジー的規定(D-5.言語理解とコミュニケーション,一般セッション)
- Princeton Annotated Gloss Corpusを用いた異言語の語彙概念の対応付け(大規模言語資源による言語知識獲得)
- 地域特有の話題発見を支援するスマートフォン向けマップ型検索システム : 発見探地図エリアダス(地理情報システム,データ工学と情報マネジメント論文)
- D-019 POI情報を利用したWeb文書からの地名の抽出(D分野:データベース)