形態素解析における高速な単語ラティス生成
スポンサーリンク
概要
- 論文の詳細を見る
This paper proposes a fast word lattice generation algorithm for Japanese morphological analysis. We conducted experiments on three Japanese data sets to demonstrate that the previously proposed pruning-based algorithm is in fact not efficient enough, and that the pipeline algorithm, which is introduced in this paper, achieves considerable speed-up without loss of accuracy. Moreover, the compactness of the lattice generated by the pipeline algorithm was investigated from both theoretical and empirical perspectives.
- 一般社団法人 人工知能学会の論文
著者
-
喜連川 優
東京大学
-
喜連川 優
東大
-
Kitsuregawa Masaru
Univ. Tokyo
-
Kitsuregawa M
Univ. Tokyo Tokyo Jpn
-
喜連川 優
東京大学|国立情報学研究所
関連論文
- 多周期的更新アクセスに適した二次記憶管理技法 : 連続的Webクローリングへの適用(ファイル編成,情報爆発論文)
- 編集にあたって(平成21年度長尾真記念特別賞紹介)
- グリーンレプリケーション : 二次系ディスクストレージの省電力化(ストレージ 並列分散データベース,データ工学論文)
- 編集にあたって(平成21年度論文賞の受賞論文紹介)
- 大規模ウェブテキストからの片仮名用言の自動獲得(テキストマイニング,データ工学論文)
- トレンドを考慮した検索クエリの分類手法の一検討
- 2.50年後の情報社会を支えるIT基盤(情報処理技術の未来地図,50周年記念特集号)
- IFIP-情報処理国際連合-近況報告(委員会から)
- ITの進展と法制度の非想定領域 : 著作権法一部改正,47-6,47-7による検索エンジンの合法化について(研究開発における情報利用と著作権)
- 50周年記念全国大会を振り返って : 7,150人もの多のくの方々にご参加いただきお礼申し上げます(記念大会が示した情報処理の未来-情報処理学会創立50周年記念(第72回)全国大会報告-)
- コラボラティブグリーンストレージ : データベースシステムとの連携によるディスクストレージ省電力化の構想(インターネットと環境・エコロジー,インターネットと環境・エコロジー,一般)
- オブジェクト指向技術とその応用論文特集の企画にあたって
- 大規模日本語Webアーカイブの構築とその分析 (特集 データマネジメント技術)
- 10.Socio Sense : 過去9年に及ぶWebアーカイブから社会の動きを読む(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- オンライントランザクション処理におけるDynamic Voltage and Frequency Scalingの消費電力削減効果に関する実験的考察 (データ工学)
- アウトオブオーダー型データベースエンジンOoODEの構想と初期実験
- 9.ストレージフュージョン : ストレージシステムとデータベース管理システムの融合(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- Webマイニングにおける語義曖昧性解消のための擬似負例を用いた能動学習
- オンライントランザクション処理におけるDynamic Voltage and Frequency Scalingの消費電力削減効果に関する実験的考察(実世界データ処理,モバイルデータベースとGIS及び一般)
- 大規模Webアーカイブ更新のための階層的スケジューリング手法
- 情報爆発論文特集の発行にあたって(情報爆発論文)
- データベース
- 編集長インタビュー 喜連川優 東京大学生産技術研究所教授 "検索"を超える基盤を作りたい
- 編集にあたって(平成20年度論文賞の受賞論文紹介)
- 編集にあたって(平成20年度長尾真記念特別賞紹介)
- IFIP-情報処理国際連合-近況報告(委員会から)
- 6R-3 ディスクストレージ省電力化型問合せ実行方式に関する一考察(データベース技術,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 6R-5 An Experimental Study on Basic Performance of Flash SSDs with Micro Benchmarks and Real Access Traces
- 6R-4 アプリケーション指向ディスクドライブ省電力方式の一考察 : OLTP系DBMSのI/O挙動特性に基づくディスクドライブ省電力の効果(データベース技術,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 1K-5 地球観測データに対するメタデータ登録システムの構築 : データセットドキュメントメタファを利用したメタデータ登録(情報爆発時代における大規模画像処理システム,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 5K-7 大規模Webアーカイブにおける時間分解能向上手法の検討(情報爆発時代におけるWeb解析,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 1K-7 アジアモンスーン解析のための三次元気象データ可視化システム(情報爆発時代における大規模画像処理システム,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 1K-6 水産資源研究のための粒子追跡シミュレーション : インタフェースの作成(情報爆発時代における大規模画像処理システム,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 1K-4 多様な地球環境データを対象としたマイニングシステムの構築(情報爆発時代における大規模画像処理システム,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 3K-1 自然言語処理における系列ラベリング問題のための高速で厳密な漸次的複合化アルゴリズム(情報爆発時代におけるテキスト処理・Wikipedia,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 4ZP-8 時間変化を考慮した検索クエリのクラスタリングにおけるクエリ間類似度の検討(情報爆発時代におけるWeb検索技術,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 6K-8 Jumbo : a data intensive distributed computation platform : design overview and preliminary experiment
- 5K-6 時系列情報をもつウェブグラフ発達過程の3次元可視化(情報爆発時代におけるWeb解析,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 3K-2 組み合わせ素性に基づく分類器の効率的学習法(情報爆発時代におけるテキスト処理・Wikipedia,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 2K-3 隠れマルコフモデルによるデータストリームのモニタリング手法(情報爆発時代におけるアルゴリズム高率化,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 5K-4 A study on Historical Web Graph Extraction
- Hmine-rev : H-mine並列化に向けて大容量データベースにおける頻出パターンマイニングに関する研究(データマイニング, 夏のデータベースワークショップ2005)
- 新動詞の成立にみる意味と形の変化の相関--「ファブる」と「モフる」の分析から
- インタビュー 喜連川優氏 東京大学生産技術研究所 教授 ぶっとんだ発想を出そう
- 戦略情報融合国際研究センター
- ストレージとDBMSの連携によるI/O性能障害の統合診断支援方式の開発と評価
- Performance Evaluation of KD-Join Algorithm
- Implementation Technique of Join Operation on KD-Tree Indexed Relations
- 3J-7 Multimedia Object Placement in Transcoding-enabled Wide-area Storage Systems
- データベースマシンGRACEの同時実行制御
- 時々刻々と成長するグラフのための中心性モニタリング
- 次世代ITプラットフォームが可能にする情報爆発時代における「知」の創造 (特集 Big Dataにより新たな価値を創出する次世代ITプラットフォーム)
- オンライントランザクション処理におけるスループットを考慮したプロセッサ省電力手法の実験的考察
- OLTPを対象としたアプリケーション協調型大規模ストレージ省電力制御方式の提案及び評価
- D-002 中規模IP-SANでの高多重度I/O処理の解析と性能向上手法(D分野:データベース)
- 2J-4 Efficient General Dominant Relationship Analysis based on Partial Order Models
- 1.情報爆発のこれまでとこれから(情報爆発が創り出すサイバーフィジカルな情報処理)
- オンライントランザクション処理におけるDynamic Voltage and Frequency Scalingを用いたアプリケーション指向省電力手法の実験的考察(一般(ストリーム・匿名性・省電力),e-ScienceとData Intensive Science及び一般)
- Dynamic Load Balancing in Right-Deep Pipelined Joins
- Extreme Skew Handling in Right-Deep Multi-Joins
- PDBFM:フィールドモニタリングのためのデータブラウザ
- Webテキストを対象とした語義曖昧性解消のための言語資源の半自動構築
- 特集「情報爆発時代におけるIT基盤技術」の編集と査読,編集における「べからず集」の実践にあたって
- 1J-6 EcoR : An Economic Incentive model for facilitating storage of materialized query results in Mobile-P2P environments
- データインテンシブアプリケーションI/O挙動解析評価とストレージ電力制御モデルの提案(一般セッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- データインテンシブアプリケーションI/O挙動解析評価とストレージ電力制御モデルの提案(一般セッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- マイクロブログ上の流言に対するユーザの態度の分類(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- マイクロブログ上の流言に対するユーザの態度の分類(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- SSD環境を対象としたDynamic Voltage and Frequency Scaling制御によるオンライントランザクション処理省電力化の実験的考察(一般セッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- SSD環境を対象としたDynamic Voltage and Frequency Scaling制御によるオンライントランザクション処理省電力化の実験的考察(一般セッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 無線センサネットワークシステムにおける分散化フィルタリング機構に関する一考察(ストリーミング,アーバンセンシングによる情報創出とその応用,及び一般)
- アプリケーション処理のI/O挙動特性を利用したディスクの実行時省電力手法とその評価 : オンライントランザクション処理における省電力効果(データ工学、Web情報システム,学生論文)
- 特別インタビュー 第4のメディアが作り出すビッグデータの時代 (特集 ビッグデータ活用時代 : 革新的な洞察に導かれる次世代のビジネス戦略)
- サイバーフィジカルサービスと明日へのIT
- オンライントランザクション処理におけるVM挙動の詳細解析
- 6J-3 User-Assisted Similarity Estimation for Searching Related Web Pages
- ITをイネーブラとするプラットフォーマ学会を目指す:若手やんちゃ枠も作りたい -会長就任にあたって-
- マイクロブログにおける対話ネットワークと投稿内容を併用したユーザ推薦に関する一考察
- マイクロブログにおける対話ネットワークと投稿内容を併用したユーザ推薦に関する一考察
- SSDを利用したリレーショナルデータベースにおける大規模意思決定支援クエリ処理性能の特性
- SSDを利用したリレーショナルデータベースにおける大規模意思決定支援クエリ処理性能の特性
- マイクロブログを用いた鉄道の運行トラブル状況抽出に関する一検討
- マイクロブログを用いた鉄道の運行トラブル状況抽出に関する一検討
- 分散非共有計算機上におけるBtreeインデックスに対するヒート分散手法のシミュレーションによる評価
- 電力を考慮したアプリケーション構築のための計算機システムの提案
- VMライブマイグレーションにおける大規模I/O処理挙動に関する一考察(ストリーム処理とI/O,ビックデータ工学及び一般)
- テキストデータの未来関連情報における予定変更情報の獲得に関する研究
- アウトオブオーダ型データベースエンジンOoODEの試作実装と小規模実験環境におけるソフトウェア実行挙動の観測
- マイクロブログを用いた鉄道の運行トラブル状況抽出に関する一検討 (データ工学)
- マイクロブログにおける対話ネットワークと投稿内容を併用したユーザ推薦に関する一考察 (データ工学)
- 時々刻々と成長するグラフのための直径モニタリング
- マイクロブログからの鉄道の運行トラブル発生検出および継続状況の抽出 (特集 「機械学習と自然言語処理への応用」および一般)
- 効率的なテキストストリーム処理のための自己適応的分類器 (特集 「人工知能とデータサイエンス」および一般)
- 語彙正規化との同時処理による高精度な形態素解析 (特集 「人工知能とデータサイエンス」および一般)
- 形態素解析における高速な単語ラティス生成
- SSDを利用したリレーショナルデータベースにおける大規模意思決定支i援クエリ処理性能の特性(ストレージ,ビッグデータを対象とした管理・情報検索・知識獲得及び一般)
- マイクロブログを用いた鉄道の運行トラブル状況抽出に関する一検討(twitter・ソーシャルネットワーク,ビッグデータを対象とした管理・情報検索・知識獲得及び一般)
- 未知語を考慮した形態素解析のための単語ラティスの効率的な生成方法
- マイクロブログにおける対話ネットワークと投稿内容を併用したユーザ推薦に関する一考察(twitter・ソーシャルネットワーク,ビッグデータを対象とした管理・情報検索・知識獲得及び一般)
- アウトオブオーダ型クエリ実行に基づくプラグイン可能なデータベースエンジン加速機構