ベイジアンフィルターを用いたTwitterにおけるツイートのハッシュタグ分類
スポンサーリンク
概要
- 論文の詳細を見る
Twitter ではハッシュタグという,自分の投稿 (ツイート) に則した内容のインデックスをつける機能が提供されている.本研究ではハッシュタグのついていないツイートにたいしてハッシュタグを推定することを目的とする.そこでハッシュタグのついたツイートを学習し,そしてあるツイートがどのハッシュタグに属するかの推定を行った.分類器としてベイジアンフィルターを使用し,それぞれのタグについて 2 値分類を行い,複数のハッシュタグの推定を行った.実験では 50 種類のハッシュタグのつきの約 4 万件のツイートを学習データとして使用した.ツイート文にベイジアンフィルターを適用する場合は既知語に限定して処理を行うことで良い結果が得られるとわかった.
- 2011-03-21
著者
-
古宮 嘉那子
東京農工大学
-
小谷 善行
東京農工大学大学院工学府
-
小谷 善行
東京農工大
-
小谷 善行
東京農工大学工学研究院先端情報科学部門
-
古宮 嘉那子
東京農工大学工学研究院先端情報科学部門
-
竹中 姫子
東京農工大学大学院工学府情報工学専攻
関連論文
- 自然言語における選択ルール獲得の方法論(自然言語処理,人工知能分野における博士論文)
- 系列パターンを利用した決定木による自然言語における選択ルール獲得(学習・系列解析・構文解析)
- SVMを用いたリズム感のモデル化とドラムパターンの自動生成(音楽生成)
- 枝分かれ同時確率モデルを用いた「AのB」の意味分類(語彙・意味)
- すご@ぷろ : 双六をモチーフとしたビジュアルプログラミング言語
- 対話システムにおける顔文字の学習
- 特許明細書における多項請求項の自動構造化に関する研究(解析,分析)
- 構造解析を利用した機械学習による演奏表情の解析と付与(表情付け・分析)
- ウェブ上の商品情報を利用した商品のカテゴリ分類 (「Web情報処理」および一般発表)
- 枝分かれ同時確率モデルを用いた対象-属性-属性値関係の抽出(翻訳・要約・抽出)
- HMMとテキスト分類器による対話の段落分割
- 発話を出力単位とするHMMによる対話に対する話題分割
- 発話を出力単位とするHMMによる対話に対する話題分割(対話)
- 枝分かれ構造を持つ同時確率モデルによる形態素解析
- 枝分かれモデルによるbi-gramからのtri-gram推定を用いたHMM形態素解析システム
- 枝分かれ構造をもつ同時確率モデルによる形態素解析
- GMDHニューラルネットワークを利用した自然言語の区切り位置予測の研究
- 単語長を考慮した最長しりとり問題の実験的考察
- 単語間情報とランダム性を利用した創造性を有する概念ネットワークの自動生成(概念・連想)
- 単語間情報とランダム性を利用した創造性を有する概念ネットワークの自動生成
- 文字数最大しりとり問題の解法
- 単語の結束度と文の表層情報を組み合わせたテキストセグメンテーション(セグメンテーション・要約)
- 相互情報量を用いた話題語集合による対話の応答選択(対話)
- 最大長しりとり問題の解法
- 言語クラスEMGを用いた不完全なシーケンスからの構造推定手法
- MTD(f)の改良と評価
- 「名詞と表層格」パターンに対する深層格対応の推測
- 隠れマルコフモデルを用いた曲構造を持つ音符列の生成
- 音楽記述文法EMGによる楽曲受理処理系の試作(セッション7 : モデルと文法)
- Hexゲームを解く
- パターンを使った構文解析
- 品詞列に基づく構文解析
- 発話の働きとキーワードから応答生成を行う事例ベース自由対話系
- 文節区切りのための品詞列統計情報の調査
- 将棋におけるDual Credit探索
- 将棋におけるプロの指し手とそれ以外の手の判別分析
- 対戦相手に合わせた評価関数の学習システム
- プロの棋譜を用いたTD法による将棋の評価関数の学習
- TD(λ,μ) : 未来の観測状態を考慮したTD法
- 未来の観測状態を考慮したTD法について
- 将棋プログラムにおける指し手の種類別探索深さの調整
- 将棋におけるゲーム木探索アルゴリズムの比較
- 1N-4 将棋におけるcost functionを用いた評価関数の調整
- 日本語アクセントの認識実験とメロディー自動生成
- 決定木学習による代名詞「自分」の照応解析(解析・言語資源)
- 5U-4 決定木学習を用いた人名情報抽出のための規則生成(情報抽出,学生セッション,人工知能と認知科学)
- 決定木を用いた中国語の疑問文の訳語選択ルールの生成(翻訳・多言語化)
- 線形言語のある部分言語族に対する質問を用いた確率的近似学習
- 先読みを教師とした兄弟局面の比較に基づく評価関数の学習(学習2 並列探索)
- 評価関数の強化学習における学習高速化手法(学習2 並列探索)
- 並列局面探索における待ち行列の負荷分散(学習2 並列探索)
- UCTアルゴリズムにおける確率的な試行回数削減方法
- 異なるレーティング・データの接合とコンピュータ将棋の強さ予測
- 5X-4 隠れマルコフモデルを用いた変奏の伴う楽曲の自動生成(音楽情報科学(4)表情付け・認知,学生セッション,人工知能と認知科学)
- モンテカルロシミュレーションを用いた強化学習法の提案
- 状態をもった内部表現でプログラムを保持するプログラミング教育環境の有効性の検討(情報教育/一般)
- 枝分かれ同時確率モデルを用いた対象-属性-属性値関係の抽出(翻訳・要約・抽出)
- 枝分かれ同時確率モデルを用いた「AのB」の意味分類(語彙・意味)
- 決定木を用いた敬語の選択ルールの獲得
- 構造解析を利用した機械学習による演奏表情の解析と付与(表情付け・分析)
- Nested Monte-Carlo探索のAMAFを用いた探索数調整による改良
- 虫食い算の非探索的解決と問題作成への応用
- 語義曖昧性解消のための領域適応手法の自動選択
- 音高と音価の隠れマルコフモデルを用いた自動副旋律生成
- HMM とテキスト分類器による対話の段落分割
- 囲碁におけるシミュレーション結果の継承を用いたモンテカルロ法の改良
- 溢れ碁ルールの提案とそれを用いた囲碁の小路盤探索
- コンピュータブロックスデュオ大会報告 (2007年10月,2008年10月)
- 図形合同分割パズルの自動生成(Session 2)
- 最長しりとり問題の解法
- Heptamond問題の全解数推定
- コンピュータブロックスデュオ大会報告 : 2007年10月, 2008年10月
- 勝率に近似させた評価関数の性能について
- 1T-5 DPマッチングによる繰り返し構造を含んだ旋律の自動生成(音楽分析・生成,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 6W-7 情報エントロピを用いた格フレームの用例の汎化(構文解析・生成・学習,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 将棋を指すコンピュータの数理(11)詰将棋の自動生成
- 将棋を指すコンピュータの数理(第10回)詰将棋の論理
- 引き分けの証明向きのGHI問題対処法とその3x4将棋への応用(知識処理)
- 制限のあるサンプル分布における文脈自由文法の学習可能性
- 単語の偏りを表すネットワークを用いたウェブページに対するキーワード付け(語と慣用句)
- ニューラルネットワークを用いた多人数対話での対話の繋がり抽出(翻訳,対話)
- 隠れマルコフモデルを用いた副旋律推定
- 質問と反例による単純決定性言語の多項式時間学習を可能とさせる十分条件
- 単純決定性言語の学習におけるサンプル分布のある制限と学習可能性
- 線形言語のある部分言語族に対する多項式時間PAC学習可能性
- 線形言語のある部分言語族に対する質問と特徴的なサンプルによる多項式時間学習アルゴリズム (計算機科学基礎理論の新展開)
- ベイジアンフィルターを用いたTwitterにおけるツイートのハッシュタグ分類
- ベイジアンフィルターを用いたTwitterにおけるツイートのハッシュタグ分類
- WEBニュース中の複数企業に対応した株価予測(統計的言語処理,テキスト・Webマイニング,一般)
- 四川省パズルにおける状態空間構造を利用した難易度判定
- ゲーム情報学におけるパズル研究 (特集 ゲーム情報学)
- ソーシャルタグの単語分割による楽曲推薦(「クラウドソーシング」及び一般)
- ソーシャルタグの単語分割による楽曲推薦
- 語義曖昧性解消のための領域適応手法の決定木学習による自動選択
- 顔文字情報の半教師有り学習を利用した事例ベース対話システム(テキスト・談話,思考と言語一般)
- コンピュータ将棋におけるSVMを用いたMove Orderingの効率化
- 麻雀における手牌と残り牌からの上がり探索による着手決定アルゴリズムCHE
- SVRを用いた麻雀における捨て牌の危険度の推定
- 外国人の検索クエリに対する音訳手法の適用
- 文書分類のための Negation Naive Bayes