音声認識を用いたマルチメディアコンテンツのインデクシング
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,音響処理,音声認識処理,自然言語処理,映像インデクシング処理を統合したマルチメディアコンテンツの自動インデクシングシステムについて報告する.このシステムは,主にニュースコンテンツを対象として,コンテンツの構造や内容を記述するメタデータを自動生成することにより,コンテンツに対する高度なアクセスインタフェースを提供する.音響セグメンテーション,音声認識結果に対するトピックセグメンテーション,映像カット点の情報を統合することによりコンテンツの構造を自動的に抽出する.評価実験により複数の情報の統合がコンテンツの構造抽出の精度向上に貢献することを確認した.
- 2003-07-18
著者
-
林 良彦
大阪大学大学院言語文化研究科
-
別所 克人
日本電信電話株式会社NTTサイバーソリューション研究所
-
松永 昭一
長崎大学工学部
-
林 良彦
日本電信電話株式会社nttサイバースペース研究所
-
大附 克年
日本電信電話株式会社NTTサイバースペース研究所
-
松尾 義博
日本電信電話株式会社NTTサイバースペース研究所
-
大附 克年
早大・理工
-
水野 理
日本電信電話株式会社NTTサイバースペース研究所
-
松永 昭一
日本電信電話株式会社NTTサイバースペース研究所
-
大附 克年
マイクロソフトディベロップメント株式会社
-
別所 克人
日本電信電話株式会社サイバーソリューション研究所
-
水野 理
日本電信電話株式会社nttサイバースペース研究所:(現)東日本電信電話株式会社通信機器事業部
-
林 良彦
日本電信電話(株)nttサイバースペース研究所
関連論文
- 言語的オントロジーの構築と展開(オントロジーの進化と普及(前編))
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- 話題構造抽出に基づく会議音声インデクシングシステム(音声,聴覚)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3,コンピュータビジョンとパターン認識のための学習理論)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3)
- 言語的オントロジーの構築と展開
- A-14-6 3人会話における非言語情報と「場の活性度」との相関の調査(A-14.ヒューマンコミュニケーション基礎,一般セッション)
- D-5-13 日本語係り受け構造の標準形式の検討(D-5.言語理解とコミュニケーション,一般セッション)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- 機械翻訳を介したコミュニケーションにおける利用者の機械翻訳システム適応の言語依存性
- 機械翻訳システムに対する利用者適応の分析 : 異文化コラボレーションを目指して(一般 : データマイニングI)
- テキスト選択に基づくタスク依存言語モデル構築の検討
- 複数回会話における会話特徴の変遷 : 2人会話がその後に行う3人会話に与える影響(コミュニケーション支援,一般)
- 複数回会話における会話特徴の変遷 : 2人会話がその後に行う3人会話に与える影響(コミュニケーション支援,一般)
- 3人会話における非言語情報と「場の活性度」に関する検討(一般,「コミュニケーション研究の今,その先」及び一般)
- 2人会話における非言語手ががりと関係開始スキルについての研究(2)(一般,「コミュニケーション研究の今,その先」及び一般)
- 2人会話における非言語手ががりと関係開始スキルについての研究(1)(一般,「コミュニケーション研究の今,その先」及び一般)
- 関連語彙獲得に基づく認識辞書のオフライン教師なし適応(音声・音響処理)
- 関連語彙獲得に基づく認識辞書のオフライン教師なし適応(音声・音響処理)
- D-14-11 音声認識結果の単語系列の言語的妥当性に基づく正誤判定(D-14. 音声・聴覚)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 対話における共感状態の音声情報からの推定(言語コミュニケーションとそのフィールド)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- グラフモデルの提案とテキスト検索システムへの適用による評価
- 2000-DBS-122-47 構造化文書をランキング可能な全文検索システム
- DE2000-69 構造化文書をランキング可能な全文検索システム
- 多言語分散情報検索アーキテクチャに関する検討
- 多言語分散情報検索アーキテクチャに関する検討
- SLP・NL合同セッション「ここまでできるぞ音声/言語処理技術」 : 言語編 : 5 クロスリンガルWWWサ-チエンジンTITAN
- 検索結果の再構成によるナビゲーション支援
- インターネット情報探索システムTITANとその可視化手法
- WWW 情報空間における Resource Discovery と Navigation 支援
- 日本文推破支援システムにおける書換え支援機能の実現方式
- D-5-12 オントロジーに基づく言語サービス体系の検討(D-5.言語理解とコミュニケーション,一般セッション)
- 対話における共感状態の音声分析(一般,「コミュニケーション研究の今,その先」及び一般)
- N-best候補を用いた話題抽出の検討
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- 説明的テキストにおける文の連接関係の解析手法
- 大語彙連続音声認識を用いた音声・映像コンテンツのインデクシング
- 音声認識・言語処理の適用によるコンテンツ内容記述メタデータの生成 (特集 メタデータ応用サービスおよび関連技術の動向)
- 2D-6 対話における共感状態の分析(音声・音楽情報処理,一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 言諸資源に関する国際標準とオントロジーに基づく言語サービスの検討(言語グリッドと異文化コラボレーション)
- RJ-002 自由対話における発話の共感状態の音声分析(J分野:ヒューマンコミュニケーション&インタラクション,査読付き論文)
- 3D-6 絵文字を考慮したテキスト解析の研究(自然言語処理(1),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 書き起こし想定発話の音声認識における言語モデルの検討
- 音素履歴近似とDelayed Bigramを用いた効率的探索手法の検討
- 時間非同期ビーム探索に基づく第二パスを用いた連続音声確認(音声処理技術のデモの紹介)
- 音声表記・音韻表記に基づく効率的で使い易いシンハラ語入力方式(インタフェースと応用)
- 単語・意味属性間共起に基づくコーパス概念ベースの生成方式
- 未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
- 未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- D-5-5 クエリログを利用した未知語抽出手法(D-5. 言語理解とコミュニケーション,一般セッション)
- 学習データのクラスタリングを用いた文書分類(手法検討,ライフログ活用技術,オフィス情報システム,ライフインテリジェンス)
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- D-14-19 ニュースコンテンツにおける音響信号自動判別の検討
- F-4 概念ベクトルによるトピックセグメンテーションのニュース音声への適用(音声・音声言語情報処理,F.音声・音楽)
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- 単語・意味属性間共起に基づく単語間の階層関係の抽出(言語理解とオントロジーシンポジウム)
- 小学生音声データベースを用いた子供音声認識の検討(音声,聴覚)
- D-14-15 日本人英語音声認識における話者適応の検討
- 小学生音声データベースの構築とそれを用いた子供音声認識の一検討
- 小学生音声データベースの構築と評価
- マルチパス探索における第2パス探索法
- 音声認識エンジンVoiceRexを用いたリハビリ所見入力用音声ワープロ
- 音声認識エンジンVoiceRexによるニュース放送音声認識
- マルチパス探索における第2パス探索法の検討
- 音声認識エンジンVoiceRexによる文書作成--連続音声認識機能を用いた音声ワープロ (特集 ここまできた音声認識・音声合成)
- 適応音響モデルを用いた放送ニュース音声認識
- 音源識別のための環境音クラスタリングの効果(合成,生成,韻律,一般)
- 電子メールにおける重要文抽出と携帯電話向け要約システムへの適用(コンテンツ処理)
- WWW上の検索サービスの技術動向
- 探索ロボットに基づくWWWサーチエンジン : TITANを中心に
- 技術文章向けの日本文推敲支援システムの実現と評価
- 92-39 自然言語テキストのロバストな処理
- 日本語受動文の能動化可否判定アルゴリズムの検討
- 接続構造解析に基づく日本語複文の分割
- 91-31 語彙的結合関係による構文多義の解消
- D-5-5 RESTアーキテクチャによる言語資源のWebサービス化の検討(D-5.言語理解とコミュニケーション,一般セッション)
- 再利用・相互運用可能な言語資源の記述とモデル化の枠組み(異文化コラボレーション論文)
- セマンティックWebと言語資源・言語技術
- 漢字の自律学習のための読み誤りの自動生成(言語の学習・教育)
- 漢字の自律学習のための読み誤りの自動生成
- D-5-6 日本語解析の標準化へ向けた機能表現辞書の適用性(D-5.言語理解とコミュニケーション,一般セッション)
- 言語資源に関する国際標準とオントロジーに基づく言語サービスの検討
- 協調的な言語サービス基盤上における複合辞書アクセスサービスの検討(言語グリッドと異文化コラボレーション)
- 単語・意味属性間共起に基づく概念ベースの拡張方式
- クラスタ内変動最小基準に基づくテキストセグメンテーション(自然言語)
- クラスター内変動最小アルゴリズムに基づくトピックセグメンテーション
- 単語の概念ベクトルを用いたテキストセグメンテーション(21世紀のグループウェア)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- D-8-15 辞書アクセスWebサービスにおけるルールに基づくHTMLの動的生成(D-8.人工知能と知識処理,一般セッション)
- D-5-8 標準的な言語解析機能のオントロジー的規定(D-5.言語理解とコミュニケーション,一般セッション)
- Princeton Annotated Gloss Corpusを用いた異言語の語彙概念の対応付け(大規模言語資源による言語知識獲得)
- 単語概念ベクトルを用いた文書群からの代表語抽出
- 単語概念ベクトルを用いた文書群からの代表語抽出