形態素解析情報に基づく長い日本語ニュース文の分割
スポンサーリンク
概要
- 論文の詳細を見る
我々は日本語テレビニュース文を英語に機械翻訳する研究を行っている。日本語ニュース文は約80%が60文字(約30単語)以上で書かれている。このニュース文は、ほとんど引用、並列構造を持っている。このような長文を構文分析する場合、その成功率を高めるには、長文をいくつかの単文に分割することが有効である。人手による分割実験によると分割される前の状態での構文分析の成功率は約60%で、文分割後の構文分析の成功率は82%に増加する。ここでは、形態素解析情報、特に、格助詞「が」、係助詞「は」と用言の活用情報によって接続構造と分割点を把握できることに注目して、適切な分割点の検出と主語の補完を含む分割の生成を行う方法を提案し、その有効性を述べる。
- 1992-02-24
著者
-
金 淵培
NHK放送技術研究所
-
江原 暉将
NHK放送技術研究所
-
相沢 輝昭
NHK放送技術研究所
-
相沢 輝昭
広島市立大学
-
江原 暉将
Nhk放送技術研究所:(現)諏訪東京理科大学
-
江原 暉将
Japan Broadcasting Corp. (nhk)
関連論文
- 部分文字列への最適な分割と文脈を考慮した変換による翻字処理(自然言語処理)
- D-23 MPEG-7を用いた情報提示システムに関する一検討(映像メタデータ処理,D.データベース)
- シーン内のテキストの認識および翻訳
- 機械翻訳カメラ
- 聴覚障害者向けニュースの字幕提示方法に関する主観評価(人間の視覚・聴覚情報)
- 意味分類番号を用いた主語・述語の整合度の計算方法
- 形態素解析情報に基づく長い日本語ニュース文の分割
- 統計手法と言語特徴を用いたテキストアライメント
- E-015 複合語翻訳による異言語で記述された書誌情報の同定(E.自然言語・文書・ゲーム)
- 8-4 エージェントテレビのための自動番組選択手法の検討
- 個人の嗜好に合ったテレビ番組を自動編成するエージェントの検討
- エージェントTV
- 論文データベースからのイディオム用例検索(検索)
- 文書横断文間関係を考慮した動向情報の抽出と可視化(情報抽出・可視化)
- 特許, 論文データベースを統合した検索環境の構築(重要語抽出・検索・文書分類)
- 文書横断文間関係を考慮した動向情報の抽出と可視化(情報抽出・可視化)
- 特許, 論文データベースを統合した検索環境の構築(重要語抽出・検索・文書分類)
- 英語固有名詞の片カナ変換
- 機械翻訳系と放送系とのインターフェイス
- World Wide Webを用いた外国人名の英訳自動獲得(自然言語)
- 翻訳用例提示システムの設計・開発・運用
- 嗜好を考慮した評判情報検索手法(Web情報処理)
- 嗜好を考慮した評判情報検索手法(Web情報処理)
- 語の好感度に基づく自然言語発話からの情緒生起手法
- 肯定/否定意図を検出するチャットシステムのためのあいづち生成手法
- 配列アラインメントを用いた形態素レベルでの逸脱解消
- コンピュ-タによる言語の翻訳
- ニュース用語の分類と誤入力訂正への適用
- 日英放送原稿翻訳者のための類似用例提示型翻訳支援システム
- ニュース音声認識のための(n≥4)-gramを併用する言語モデル
- ニュース音声認識のための(n≧4)-gramを併用する言語モデル
- ニュース専門用語英日辞書の構築
- 新しい教育放送サービスのための情報検索システム(放送現業・コンテンツ制作)
- ユーザモデルエージェントによる番組選択システム
- エージェントを利用したマルチメディア教育支援システム
- PD-1-5 放送におけるエージェント応用への試み
- 2000-ICS-121-9 エージェントを利用した映像検索のためのユーザーインターフェイス
- 2000-ICS-121-8 エージェントを応用した次世代テレビエンターテイメントシステム
- OFS2000-24 / AI2000-26 エージェントを利用した映像検索のためのユーザーインターフェイス
- OFS2000-23 / AI2000-25 エージェントを応用した次世代テレビエンターテイメントシステム
- OFS2000-24 / AI2000-26 エージェントを利用した映像検索のためのユーザーインターフェイス
- OFS2000-23 / AI2000-25 エージェントを応用した次世代テレビエンターテイメントシステム
- エージェントテレビ : 番組洪水から視聴者を救うテレビ (放送と情報処理)
- 8-3 ニュース原稿のクラスタリングを用いたトピック抽出
- 確率モデルによるゼロ主語の補完
- 固有ベクトル分析を用いた主語特徴の評価
- 人にやさしい放送と自然言語処理
- 放送ニュース文を対象とした効果的類似用例検索法
- 衛星放送用機械翻訳の辞書の改修 (慣用表現を中心に)
- 日英ニュース原稿の対訳コーパス化に関する基礎調査
- 4.1 音声処理と翻訳(4.応用技術)(最近の音声処理技術)
- AP電経済ニュースからの定型パターンの抽出
- 統計的手法を用いた日英放送原稿の単語対応づけ
- 統計手法と言語特徴を用いたテキストアライメント
- FIPAにおけるエージェント技術の標準化
- 短文分割の自動要約への効果
- 7.エージェント技術の標準化 : FIPA(パートナーとしての映像情報技術-エージェント技術)
- 衛星放送ワールドニュースの英日機械翻訳
- 5. 放送メディアにおける知能情報処理技術 (<特集>ネットワーク社会を支援する新しい知能メディア技術)
- 高速な依存構造解析アルゴリズム
- 実験用字幕つきテレビニュースの制作と字幕表示法に関する予備評価
- 学習可能性の理論 (情報科学の数学的理論)
- シナリオを対象とした構文解析規則記述法
- 字幕作成のための翻訳ワークベンチ
- 対訳データからの「訳し分け情報」の自動学習
- 基本動詞と動作名詞の組み合わせ表現の英日機械翻訳手法
- 双方向機械翻訳システムを利用した外国語ワードプロセッサ
- 外電経済ニュースの英日機械翻訳
- 衛星放送ニュース文の英語解析文法
- AP電経済ニュースの英語解析用文法
- 外電経済ニュースの英日機械翻訳
- 自然言語による映像シーケンサ(新映像メディアとその応用)
- 特集「情報化社会への視聴覚障害者の参加を考える」の編集にあたって
- 依存関係整合度の計算法(その2)
- 心象の変化を考慮した指示詞の照応解析
- 日本語ゼロ代名詞補完のためのグローバルトピックの役割
- 自由展開タイプの対話のための対話処理システムに関する考察
- 対話型データ検索・処理システムSCLAMS
- 関係データベースの等価変換
- 文脈による言語の位相 (オートマトン理論と数理言語の研究)
- 英語ニュースデータベースの構築
- 英日機械翻訳における固有名詞処理
- 静止画検索システム FORKS の試作
- シーン記述文の類似性を用いた番組自動要約システム
- 学会活動について
- 15-4 静止画像連想検索方式の検討
- 自然言語処理「構文解析」特集号 巻頭言
- 編集にあたって(文科系大学・学部における情報教育)
- 係り受け整合度を計算するいくつかの統計的手法の比較
- 係り受け整合度を計算するいくつかの統計的手法の比較
- 最大エントロピー法を用いてバイグラム確率からnグラム確率を求める
- 日本語「が」格の係り受け整合度の一計算法 : 基準名詞の個数に関する考察
- 最大エントロピー法を用いてバイグラム確率からnグラム確率を求める
- 最大エントロピー法を用いてnグラム確率をバイグラム確率で補完する方法
- 衛星放送・英日機械翻訳システムの辞書整備
- 結合価パターンを用いた : 深層格抽出法の一検討
- 依存関係整合度の1計算法
- 機械翻訳の正翻訳率と翻訳に要する作業時間の関係
- 構文解析失敗の原因となる表現法の検出
- 経路代数を用いた文節の生成法