Webと携帯端末向けの新聞記事の対応コーパスからの文末言い換え抽出
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,数十文字程度の長さで携帯端末向けに配信されている新聞記事と数百文字程度の長さのWeb 新聞記事の両者を約3 年に渡って収集した.こうして収集したコーパスから文末表現の縮約などの言い換え表現の抽出を機械的に行った.まず,Web から収集した携帯向け新聞記事とWeb 新聞記事からなるコーパスに対して記事単位の対応付けを行い,次に文単位の対応付けを行った.次に携帯向け記事文の文末の表現を形態素解析を用いて抽出し,その文に対応するWeb 新聞記事の文を集める.そしてWeb 新聞記事の文の文末から形態素ごとに言い換え先表現を抽出し,それに対して頻度等を用いた得点付け,および必要な名詞を欠落させてしまう不適切な言い換えの除去を行うことにより言い換え表現の抽出精度向上を図った.We have collected both Web news-paper articles of several hundreds of characters, for three years and their counter parts distributed for mobile terminals, which consist of fifty to a hundred characters. Then, we extracted a number of candidates of paraphrases of the final part of sentences from them automatically. At first we have aligned these two types of corpus first at article level, then at sentence level. Next, we extract the final part of mobile article sentences using morphological analyzer, and collect their counterpart expressions of Web article sentences. Finally, we extracted the candidates of morpheme sequence from the final part of Web article sentence, then we propose the combination of two methods for them in order to improve the extraction accuracy of the sets: 1) ranking based on frequency, branching factor and length of string, and 2) filtering to remove inappropriate expressions which eliminate semantically indispensable nouns.
- 言語処理学会,The Association for Natural Language Processing,東京電機大学工学部,東京大学情報基盤センター,School of Engineering, Tokyo Denki University,Information Technology Center,The University of Tokyoの論文
著者
関連論文
- Word 2003 XML文書への情報ハイディングシステム
- 2C-8 インスタンスモデルベースのクラス図検証システムの構築
- 対話的にオブジェクトモデルを確認するためのインスタンス図導出システムの作成
- オブジェクトモデルの演繹的確認法とその有効性の検討
- オブジェクト指向開発技術の問題点の分岐と解決法の提案 : エレベータ作業計画作成システムの移植・拡張の事例による
- オブジェクトモデルの演繹的確認のためのインスタンス図生成手法
- オブジェクトモデル作成時の過程における四要素の役割分担についての考察
- オブジェクトモデル作成時の過程とその支援機能の検討
- オブジェクトモデルを構築する際に可能な支援機能の実装
- オブジェクトモデル構築の過程とその支援機能の検討
- 初心者を考慮したオブジェクト図エディタの構築
- 初心者を考慮したオブジェクト図エディタの検討
- マルチユーザで利用可能なオブジェクト図エディタの構築
- アプリケーション実行時GUI部品カスタマイズ機能の評価実験
- グループ内でのOOA/OODのモデル構築を行なうための抽象化支援システム
- ユーザレベルでカスタマイズ可能なGUI部品の交換・付加機能
- 実アプリケーションを利用したユーザ自身によるGUIレイアウト変更実験
- ASIA(Available and selectable Interface Adaptor) : ユーザが状況に応じて選択可能なインタフェースアダプタ
- アプリケーション実行時GUIレイアウト変更機能の評価実験
- アプリケーション実行時 GUI レイアウト変更機能
- HTMLの表形式データの構造認識と携帯端末表示への応用
- HTMLの表形式データの変換と携帯端末表示への応用
- 図書館における自動レファレンスサービスシステムの実現 : Web上の二次情報と図書館の一次情報の統合(セッション1:文化・知的財産情報の統合と管理,学生チャレンジ特集)
- 図書館における自動レファレンスサービスシステムの実現 : Web上の二次情報と図書館の一次情報の統合(セッション1:文化・知的財産情報の統合と管理,学生チャレンジ特集)
- E-013 数値による新聞記事テキストマイニングシステムの提案(E分野:自然言語・音声・音楽)
- 国立国会図書館リサーチ・ナビにおけるテーマグラフの生成
- 〈情報処理学会 情報学基礎研究会 (F1) 第96回 発表論文〉 国立国会図書館リサーチ・ナビにおけるテーマグラフの生成 (筑波大学東京キャンパス(秋葉原地区). 2009年11月19日)
- 4ZK-9 図書館とWebの分類体系を統合的に活用したテーマグラフ可視化インタフェース(情報爆発時代におけるテキストデータ処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 3K-5 Wikipediaと図書館情報資源による調べ方自動提示システム(情報爆発時代におけるテキスト処理・Wikipedia,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 5ZN-6 Wikipediaにおける言語間の差異マイニング(情報爆発時代におけるWebマイニング,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 個人適応型Splogフィルタリングの実現に向けて : Splog判定データセットの構築と機械学習を用いたシステムの実装(第1回集合知シンポジウム〜言語処理が紡ぎ出す未来〜)
- O_002 Word 2003文書への情報ハイディングシステム(O分野:情報システム)
- Word 2003 XML文書への情報ハイディングシステム
- Word 2003 XML文書への情報ハイディングシステム
- ブログ記事とWebページを用いたイベント情報抽出手法の提案(セッション2:Webと社会のつながり、応用技術)
- ブログ記事とWebページを用いたイベント情報抽出手法の提案(セッション2:Webと社会のつながり、応用技術)
- ユーザ適応型Splogフィルタリングのためのユーザ固有Splog空間の分析(ウェブ情報とデータベースに関して(ポスター講演))
- E-002 実験的評価に基づくユーザ固有Splog空間の検証 : ユーザ適応型Splogフィルタリングに向けて(自然言語・音声・音楽,一般論文)
- 5J-7 スパムブログに関する定量的調査支援ツールの開発(情報爆発時代におけるWebおよびblogマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 5J-4 Wikipediaを用いた多言語ブログ検索のための訳語抽出(情報爆発時代におけるWebおよびblogマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- Webと携帯端末向けの新聞記事の対応コーパスからの文末言い換え抽出
- GUl部品の交換によるデザイン変更のためのプラグインアダプタ
- Metamerのユーザ履歴管理
- 動的なレイアウト変更を可能としたGUIの評価
- Objectchartsエディタを用いたGUIのふるまいの分析/評価
- GUIレイアウト変更要求調査とMetamerの実装
- GUIにおけるユーザの意図による対話形式の分類
- GUI対話制御の構築を支援するObjectchartsエディタの実装
- アプリケーション実行時GUI変更を可能とするカスタマイズ環境
- DEVO(Dynamically Extended View Objects) : UIMSのためのフレームワーク
- Smalltalk-80に於けるオーバラップ可能な任意形状サブビュー機能
- Smalltalk-80における拡張MVCモデルとその応用
- トピックドリフトを支援する新聞記事ナビゲーションシステム(テキスト分類・トピック解析)
- Webと携帯端末向けの新聞記事の対応コーパスからの言い換え抽出(言い換え,文法)
- ITリスク対策に関する社会的合意形成支援システムSocial-MRCの情報フィルタリング問題への試適用
- ITリスク対策に関する社会的合意形成支援システムSocial-MRCの情報フィルタリング問題への試適用
- ITリスク対策に関する社会的合意形成支援システムSocial-MRCの開発構想
- Web新聞記事の要約とその携帯端末向け記事による評価
- ブラウザ操作ログ収集ツールを用いたWebページ閲覧行動分析
- 携帯端末画面へのHTML表データの表示方法
- 複数新聞記事サイトの横断検索とトピックのドリフト支援システム
- 携帯端末向け表データ自動変換システムの構築
- リスクコミュニケーションにおけるマインドマップを用いたオピニオンリーダー意見可視化の提案
- ソーシャルメディア上の位置情報付きテキストを利用した行動分析
- ソーシャルメディア上の位置情報付きテキストを利用した行動分析
- Twitterを用いた電車遅延の自動通知
- Twitterを用いた電車遅延の自動通知
- RJ-006 リスクコミュニケーションにおけるマインドマップを用いたオピニオンリーダ意見可視化の提案(ヒューマンコミュニケーション(3),J分野:ヒューマンコミュニケーション&インタラクション)