言語横断共訓練による単語間の上位下位関係の獲得
スポンサーリンク
概要
- 論文の詳細を見る
本論文では大規模かつ高精度な知識獲得のため,言語横断共訓練(bilingual co-training)という新たな枠組みを提案する.言語横断共訓練における各言語の知識獲得プロセスは,対訳辞書などの対訳資源によってつながれ,各プロセスが協調して処理を行い,両言語の知識獲得の性能を向上させる.実験では,知識獲得のタスクの1つであるWikipediaからの上位下位関係獲得を日本語と英語を対象として行い,言語横断共訓練を適用することにより,F1値が約3.6〜10.3%改善できることを示した.さらに,2言語で用意した学習データは,その総量が同じ単言語における学習データと比較して,上位下位関係獲得処理においてより効果的であることを示した.
- 2011-12-15
著者
-
山田 一郎
NHK放送技術研究所
-
山田 一郎
独立行政法人情報通信研究機構
-
湯山 一郎
NHK放送技術研究所
-
山田 一郎
NHK 放送技術研究所
-
内元 清貴
情報通信研究機構
-
内元 清貴
通信総合研
-
橋本 力
情報通信研究機構
-
鳥澤 健太郎
独立行政法人情報通信研究機構
-
山田 一郎
Nhk名古屋放送局
関連論文
- 大域的な文章構造の類似性を利用したクローズドキャプション中の定型的な文章区間の抽出(自然言語処理)
- サンプリング技術を利用した文章類似性評価
- サンプリング技術を利用した文章類似性評価(文書分類・翻訳)
- H-007 検索技術を使う新しいテレビ視聴スタイルCurioView(画像認識・メディア理解,一般論文)
- F-024 番組字幕を利用したマルチメディア健康百科事典構築に関する検討(F分野:人工知能・ゲーム)
- E-048 同一文中に出現する複数の節間における因果関係抽出の検討(E分野:自然言語・音声・音楽)
- 16-5 MPEG-7を用いた番組情報検索システムの開発
- Webコンテンツ放送システムの基礎検討
- 番組分割に向けたクローズドキャプション中の反復句抽出(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- E-013 半教師あり学習による事物間の関係を表現する典型的な構文構造の抽出(自然言語・音声・音楽,一般論文)
- E-011 クローズドキャプションを対象とした番組シーン分割手法の検討(自然言語・音声・音楽,一般論文)
- 放送番組を素材としたマルチメディア百科事典の自動構築
- 放送番組を素材としたマルチメディア百科事典--映像被写体をクローズドキャプションから推定する
- 10)コンポーネント符号化における標本化周波数と画質(画像表示研究会(第64回)視覚情報研究会(第48回)合同)
- コンポーネント符号化における標本化周波数と画質
- 10-2 コンポーネント符号化を用いたディジタル信号処理系の構成と問題点
- E-034 番組映像とクローズドキャプションの相関性を利用した番組生成モデルの検討(E分野:自然言語・音声・音楽)
- 8-4 エージェントテレビのための自動番組選択手法の検討
- エージェントTV
- 分散処理環境下におけるコンテンツの相互運用のためのオブジェクトモデルの提案(システムプログラム)
- 分散処理環境下におけるコンテンツの相互運用に関する検討
- D-9-2 放送局内の分散処理環境におけるコンテンツの相互運用に関する検討
- DC形PDPを用いた時分割2眼立体表示法におけるクロストーク妨害とその改善
- DC形PDPを用いた時分割2眼立体画像表示法の検討
- E-001 クローズドキャプションを対象とした因果関係知識抽出の検討(E分野:自然言語)
- 画像処理シミュレータ
- E-036 クローズドキャプションを利用した番組紹介コメント自動生成の検討(自然言語・音声・音楽,一般論文)
- 7)HDTV画像のクリティカリティ測定の検討([放送方式研究会 放送現業研究会]合同)
- 6)MPEG-2MP@HL準拠HDTVコーデックの開発とその符号化画質([放送方式研究会 放送現業研究会]合同)
- 13-6 ハイビジョン番組のクリティカリティ分布の測定
- MPEG2映像符号化の画質改善の基礎検討
- HDTV画像のクリティカリティ測定の検討
- MPEG-2MP@HL準拠HDTVコーデックの開発とその符号化画質
- MPEG-2ハイビジョンコーデックの開発
- メタデータ制作・活用システムの試作
- メタデータ制作・活用システムの試作(高精細画像の処理・表示, 及び一般)
- AdaBoostを利用した字幕テキストからの定型表現文章区間抽出(テキストの類似性・文処理モデル)
- AdaBoostを利用した字幕テキストからの定型表現文章区間抽出(テキストの類似性・文処理モデル)
- 24-7 動きベクトルを用いたシーン・チェンジ検出
- インテグラル立体テレビ
- インテグラル立体テレビ
- PDP時分割2眼立体表示法とクロストーク改善による高画質化
- PDP時分割2眼立体表示法とクロストーク改善による高画質化
- アナウンスコメントを利用したサッカー番組メタデータ自動生成(機械学習による自然言語処理・言語処理を利用したメディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- アナウンスコメントを利用したサッカー番組メタデータ自動生成(機械学習による自然言語処理・言語処理を利用したメディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- K-43 遠隔グループ学習プレゼンテーションシステム(マルチメディア・仮想環境基礎4,K.ヒューマンコミュニケーション&インタラクション)
- EPGテキストとクローズドキャプション情報を利用した番組スポット候補映像区間の抽出手法(テーマセッション(3),データ工学とメディア理解との融合)
- EPGテキストとクローズドキャプション情報を利用した番組スポット候補映像区間の抽出手法(テーマセッション(3),データ工学とメディア理解との融合)
- メタデータエディタの試作 : メタデータ制作活用のプラットフォームの提案(一般セッション(3))(ユビキタスコンピューティングのためのパターン認識・メディア理解,一般)
- D-5-12 EMアルゴリズムを利用した属性名抽出の検討(D-5.言語理解とコミュニケーション,一般講演)
- アナウンサーと解説者のコメントを利用したサッカー番組セグメントメタデータ自動生成(自然言語処理)
- I_065 AdaBoostを利用したスポット候補映像区間の抽出手法(I分野:画像認識・メディア理解)
- E_017 クローズドキャプションを対象とした被写体の動作推定(E分野:自然言語)
- フィールド順次伝送によるNTSC色信号の帯域拡大
- 13-5 EDTVにおける高彩度画像ディテール補正の特性
- クローズドキャプションを利用した映像主被写体の推定手法
- E-013 クローズドキャプションを利用した被写体特定手法の検討(E分野:自然言語)
- ニュース記事に出現する用語と説明文の意味関係自動獲得
- 3次元画像情報(映像情報メディア年報)
- 2眼式立体画像における箱庭・書き割り効果の幾何学的考察(3次元映像情報メディア技術)
- CMD撮像素子を用いた広ダイナミックレンジ撮像方式
- インテグラルフォトグラフィの撮像法に関する検討
- 立体画像の臨場感・見易さと視差ベクトル分布についての一考察
- インテグラルフォトグラフィの撮像法に関する検討
- 6-2 インテグラルフォトグラフィの総合レスポンスを考慮した撮像法の検討
- 6-1 湾曲した大画面での呈示画角と心理効果
- ディスプレイの階調再現特性と周囲光の関係
- 1.3次元映像の歴史と展望(3次元映像メディアのコンピュータ合成技術)
- 無ひずみ条件に基づいた小形・軽量な立体ハイビジョンカメラの開発とその画面効果
- ハーフゾーンプレート処理を伴ったシングルサイドバンドホログラフィにおける視域拡大法 (3次元表示技術(3)ホログラフィ技術の最近の進展)
- 時分割立体カメラの基礎検討
- 時分割立体カメラの基礎検討
- 19-3 透過形LCDを用いたハイライト圧縮撮像実験
- 新しい教育放送サービスのための情報検索システム(放送現業・コンテンツ制作)
- エージェントを利用したマルチメディア教育支援システム
- エージェントテレビ : 番組洪水から視聴者を救うテレビ (放送と情報処理)
- 8-3 ニュース原稿のクラスタリングを用いたトピック抽出
- 2P-7 ニュース原稿からの話題抽出を利用したテレビ番組選択の検討
- N-41 学習コミュニティの対話を支援する仮想教室のシステム化(遠隔・協調学習,N.教育・人文科学)
- E-33 仮想教室の学習コミュニティにおける発想支援エージェントの検討(自然言語処理応用,E.自然言語・文書)
- E-030 アナウンスコメントを利用したサッカー番組のメタデータ自動生成の検討(E.自然言語・文書・ゲーム)
- メタデータ抽出・付与技術の研究動向 (メタデータ制作・活用技術 特集号)
- ネットワークと連携した新しい教育放送サービスのためのエージェント検索システム (放送におけるエージェント技術 特集号)
- ニュース記事の定型性を利用した話題要約の検討
- シーン記述文の類似性を用いた番組自動要約システム
- Co-STAR:上位下位関係獲得のための共訓練アルゴリズム
- 分布類似度とWikipediaから獲得した構造情報を利用した上位下位関係獲得
- 言語横断共訓練による単語間の上位下位関係の獲得
- ランダムウォークを利用した番組類似性評価
- Wikipediaを利用した上位下位関係の詳細化
- 7-5 Curio View : 情報検索を活用した新しい視聴スタイルの提案(第7部門 マルチメディア及びメディア処理)
- 7-9 メタデータエディタの開発(第7部門 映像コンテンツ)
- Wikipedia を利用した上位下位関係の詳細化
- 11-3 メタデータ制作・活用システムの試作(第11部門 放送現業)
- 9-1 メタデータ生成のための音声認識の改善(第9部門 メディア認識と評価I)
- 多段グラフマイニングによる新規アイテム推薦(メディアと企業経営,感性情報処理とマルチメディア技術および一般)
- 自然言語による番組制作システム
- 8-6 テレビ番組推薦のためのメタデータ付きグラフマイニング(第8部門 メディア工学3)
- 12-4 独立成分分析を用いた番組推薦のためのキーワード抽出(第12部門メディア解析)
- F-001 グラフマイニングに基づくアイテム推薦における負の評価値の利用法(F分野:人工知能・ゲーム)