キャプションと記事テキストの文字列照合による報道番組と新聞記事との対応づけの自動化
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, ニュースの各報道に対応する新聞記事をキャプションと記事の文字列照合により特定する手法を提案する. キャプションと記事中に共通に現れた文字列の長さと出現位置, 出現頻度により重みづけし, 類似度を計算する. そして類似度が最大で閥値以上のものを選ぶ. 学習サンプルによって各パラメータの値を決定した結果, 学習サンプルで再現率100%, 適合率93.2%, 約2週間後のテストサンプルで再現率98.0%, 適合率77.8% (閥値のみ決め直した場合, 再現率98.0%, 適合率84.5%), 約7力月後のテストサンプルで再現率97.1%, 適合率79.5%(閥値のみ決め直した場合, 再現率94.1%, 適合率85.3%), という精度が得られた. また事例を検討し, 長い文字列に重みを与えすぎることの弊害を明確にした.
- 社団法人情報処理学会の論文
- 1997-06-15
著者
-
渡辺 靖彦
龍谷大学理工学部情報メディア学科
-
渡辺 靖彦
龍谷大学理工学部電子情報学科
-
長尾 眞
京都大学工学部電気工学第二教室
-
角田 達彦
東京大学医科学研究所
-
大石 巧
京都大学工学研究科電子通信工学
-
角田 達彦
京都大学工学研究科電子通信工学
-
大石 巧
京都大学大学院工学研究科電子通信工学専攻
-
長尾 真
京都大学工学部電気工学第2学科
-
長尾 真
独立行政法人情報通信研究機構
-
長尾 眞
京都大学工学研究科電子通信工学
-
長尾 眞
京都大学大学院情報学研究科知能情報学専攻
-
渡辺 靖彦
龍谷大学理工学研究科情報メディア学専攻
関連論文
- 6.言語・画像のデータ依存情報処理(情報処理技術の未来地図,50周年記念特集号)
- コミュニケーションサイトに投稿されたメッセージに対する著者の推定(情報抽出(テーマセッション3))
- 国立国会図書館 館長対談(第13回)前フランス国立図書館長 ジャン-ノエル・ジャンヌネー氏 文化の多様性と知の伝承
- シーン内のテキストの認識および翻訳
- 機械翻訳カメラ
- 本の森を歩く(特別篇)館長 長尾真が読書週間に選ぶ9冊
- 表記選択支援のための優勢表記辞書の作成(語彙)
- 問い返しを用いた英作文学習支援(コミュニケーション支援(テーマセッション3))
- メールの文章における段落間の接続の強さの推定(コミュニケーション支援(テーマセッション3))
- 指の触覚特性に基づく微細形状の詳細度制御