伝統的モンゴル語の電子化方式とテキスト検索への応用(自然言語処理)
スポンサーリンク
概要
- 論文の詳細を見る
モンゴル文字による「伝統的モンゴル語」は, 標準的な電子化方式が確立されていないために, オンラインでの情報交換が困難である. モンゴル語の電子化には, モンゴル語固有の文字コードを用いる方式と, モンゴル語の発音をローマ字で表現してアスキーコードで転写する方式がある. モンゴル語は発音によって字形や意味が決まるにもかかわらず, 既存の文字コードは字形に基づいており, 発音情報を保存することができない. また, 既存の転写方式は, 一部のモンゴル文字を転写することができない, 入出力インタフェースが整備されていない, 字形変化のアルゴリズムを独自に実装しなければ利用できないなどの問題がある. 本研究は, これらの問題を解決し, より汎用性が高い転写方式と入出力インタフェースを提案する. これらはJava仮想マシン上で利用可能である. 更に, 提案内容の応用例として, モンゴル語の新聞記事を電子化し, 全文検索システムを実装した.
- 社団法人電子情報通信学会の論文
- 2005-10-01
著者
-
石川 徹也
東京大学史料編纂所・前近代日本史情報国際センター
-
藤井 敦
筑波大学大学院図書館情報メディア研究科
-
満 都拉
筑波大学大学院図書館情報メディア研究科
-
石川 徹也
筑波大学大学院図書館情報メディア研究科
-
藤井 敦
筑波大
関連論文
- 「歴史知識学」の特集にあたって(歴史知識学)
- 論文と特許を対象にした技術動向分析 第7回,第8回NTCIRワークショップ 特許マイニングタスク
- 伝統的モンゴル語と現代モンゴル語を対象とした双方向的な翻字手法(自然言語)
- 栄養素等摂取バランスを考慮した料理レシピ検索システム(コンテンツ技術,Web情報システム)
- 中国語への翻字における確率的な漢字選択手法(自然言語処理)
- 中国語への翻字における漢字選択の手法(意味・応用)
- 中国語への翻字における漢字選択の手法(意味・応用)
- モンゴル語コーパスからの外来語抽出
- 言葉の印象に基づく自動翻字手法
- 伝統的モンゴル語の電子化方式とテキスト検索への応用(自然言語処理)
- E-021 World Wide Webを用いたヘルプデスク指向の質問応答システム(E分野:自然言語)
- D-030 小説テキスト自動分類のためのジャンル推定と人物抽出(D分野:データベース)
- テキスト情報を対象としたハイブリッド型情報推薦システムにおける擬似投票方式(社会人学生論文)
- 検索質問の主題分析に基づく類似文書検索と特許検索への応用(情報検索)
- アイテムの主題分析に基づく協調フィルタリングシステムの推薦予測方式(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- アイテムの主題分析に基づく協調フィルタリングシステムの推薦予測方式(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- Webマイニングによる事典的コンテンツの構築と多様なアクセス手法(インターネット環境のコンテンツ技術及び一般)
- 検索質問文書の主題分析に基づく類似文書検索(セッション4 : 情報検索)
- 検索質問文書の主題分析に基づく類似文書検索(セッション4 : 情報検索)
- ユーザ投票と情報アイテム間類似度を併用した情報推薦システム : 擬似投票方式の提案と評価(セッション4 : コンテンツ配信と情報推薦)
- 複数Webページの要約による用語説明の自動生成(ツール,質問応答,要約)
- アイテムの主題分析に基づく協調フィルタリングシステムの推薦予測方式
- 日英特許公報を用いた対訳辞書および翻訳メモリの構築
- 説明の観点に基づくテキストの分類と要約(文書分類・要約)
- 現代モンゴル語コーパスからの外来語抽出と日蒙対訳辞書の構築
- 特許情報を用いた辞典検索システム(情報検索)
- 特許情報を用いた辞典検索システム(情報検索)
- 4U-4 料理レシピを対象とした関連検索システム(文書の分類と検索,学生セッション,人工知能と認知科学)
- 4ZK-1 時事問題に対する賛否両意見の自動収集手法(情報爆発時代におけるテキストデータ処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 時事問題に関する賛否両意見の収集(評判分析・文脈解析)
- Web検索質問の自動分類と質問応答への応用(セッション1:テキストマイニング)
- Web検索質問の自動分類と質問応答への応用(セッション1:テキストマイニング)
- 中国語への翻字における関連語抽出の効果(翻訳・多言語化)
- 中国語への翻字における関連語抽出の効果
- 百科事典としてのWWW(WWW上の情報の知的アクセスのためのテキスト処理)
- 1.キーワードサーチを超える情報爆発サーチ : 自然言語処理で価値ある未知をマイニング(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- 歴史知識Ontology構築の研究 : その論理と実際
- WWWは百科事典として使えるか? : 大規模コーパスの構築
- World Wide Webを用いた事典知識情報の抽出と組織化
- 技術文書を対象とした言語横断情報検索のための複合語翻訳
- 日本語複合語の自動分割と日英語基対訳辞書の作成
- 日米対応特許コーパスを用いた対訳抽出手法
- 日米対応特許コーパスを用いた対訳抽出手法
- 質問応答における常識的な解の選択と期待効用に基づく回答群の決定(質問応答)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 質問応答における常識的な解の選択と期待効用に基づく回答群の決定(質問応答)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- N-gramの部分的強調による定型表現への言語モデル適応手法(音声,聴覚)
- 講演音声の認識における言語モデルのタスク適応
- 音声入力型情報検索のための自由発話収録
- 単語の共起関係と構文情報を利用した単語階層関係の統計的自動識別
- LF-001 事典コーパスを用いた単語階層関係の統計的解析(F. 人工知能)
- NTCIR-3 ワークショップにおける音声入力型ウェブ検索タスク
- 歴史オントロジー構築のための史料からの人物情報抽出
- 情報フィルタリングの利用システム : 情報推薦システム(情報のフィルタリング)
- 部分N-gram頻度情報を利用した質問応答定型表現への言語モデル適応
- 音声入力型テキスト検索システムのための音声認識
- 音声入力型文書検索システムの開発とテストコレクションの構築
- 絵本に関する知識データに基づく質疑応答システムの研究
- 確率モデルを用いた日本語ゼロ代名詞の照応解析
- 特許検索における分類手法の比較評価
- E-5 多言語特許検索システムの開発と評価(要約・情報検索,E.自然言語・文書)
- 日米対応特許データに基づく対訳自動抽出
- 日本語形態素・構文解析システムJEMONIの開発と評価について
- 多言語情報検索のための複合語翻訳
- ユーザの情報利用目的に基づく検索システム
- 多言語情報検索のための複合語翻訳
- ユーザの情報利用目的に基づく検索システム
- 未知語検出を用いた語彙統制のない音声検索
- TRC(ADEAC=自治体史テキスト検索および編纂史料閲覧システム) (業者プレゼンテーション)
- 音声文書検索を用いたオンデマンド講義システム
- 音声文書検索を用いたオンデマンド講義システム
- 音声文書検索を用いたオンデマンド講義システム
- 質問翻訳と文書翻訳を統合した日英言語横断情報検索
- World Wide Webを利用した百科事典的知識の収集法 (テーマ:「エージェント技術:基礎と応用」および一般)
- 日立デジタル平凡社『世界大百科事典』の研究利用事例 (特集 デジタル百科への期待)