プログラム理解を支援するコンセプトキーワードの自動抽出法ckTF/IDF法の提案(テスト技法・保守技術,<特集>ソフトウェア工学の理論と実践)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,識別子からコンセプトキーワードを発見するためのckTF/IDF(Concept Keyword Term Frequency/Inverse DocumentFrequency)法を提案する.ckTF/IDF法は大規模なソフトウェアにおけるコンセプトキーワードの抽出に適している.その理由は以下の2つである.lつ目は,ckTF/IDF法はTF/IDF法に比べ非常に軽量であること.2つ目は識別子からコンセプトキーワードを抽出するための発見的手法を導入している点である.我々は,教育用OS udos(約5,000行)とgcc(GNU Compiler Collection, 約90万行)とを事例に予備実験を行った.予備実験の結果,ckTF/IDF法によるコンセプトキーワードの計算速度は,gccの場合,TF/IDF法と比べ新規検索で約6倍,ファイル更新にともなう再計算で約890倍も高速だった.コンセプトキーワードの抽出の精度と再現率は,udosの場合で,それぞれ57%と26%だった.これは,我々のアプローチが識別子におけるコンセプトキーワードの抽出に向いていることを示している.今後の課題は,たとえば,ckTF/IDF法を使って高速で精度の高いソースコード検索エンジンを開発することといった,コンセプトキーワードの応用である.
- 一般社団法人情報処理学会の論文
- 2007-08-15
著者
-
権藤 克彦
東京工業大学計算工学専攻
-
権藤 克彦
東京工業大学情報理工学研究科計算工学専攻
-
大場 勝
東京工業大学大学院情報理工学研究科計算工学専攻
-
権藤 克彦
東京工業大学学術国際情報センター
-
権藤 克彦
東京工業大学
-
大場 勝
東京工業大学
関連論文
- x86版DRACULAのバグ修復と予備評価
- 広範な実用Cプログラムに適用可能かつ高精度な動的境界検査ツール (システム開発論文特集)
- 開発ツールを他言語へ適用するためのAST変換の定式化
- 広範な実用Cプログラムに適用可能かつ高精度な動的境界検査ツール(ソフトウェア開発支援,システム開発論文)
- なぜソフトウェア論文を書くのは難しい(と感じる)のか
- プログラム理解のための実装レベル制約とソースコード間の追跡性の整理保存法(ソフトウェア工学)
- 特集「ソフトウェア論文」の編集にあたって
- 特集「ソフトウェア論文」の編集にあたって(ソフトウェア論文)
- 特集「ソフトウェア工学」の編集にあたって
- 「ソフトウェア工学特集」のレター論文掲載開始にあたって
- レター論文の新設, 小論文の廃止
- ソフトウェアパターン研究の発展経緯と最近の動向(ソフトウェア工学の動向報告)
- 計算モデルとしての属性文法の制限とその対処法
- Cプログラムの割込み競合の動的検出法
- ソフトウェア論文座談会
- Cプログラムのデータ競合の動的検出法
- 教育用コンパイラXCCとその可視化ツールMieruCompiler
- バージョン管理システムの利用コストと,その軽減手法
- 複合要因によるリソース誤解放を回避するための新しいCキーワードの提案と予備評価
- DRACULA : シグナルによるデータ競合の検出ツール(ソフトウェア工学)
- プログラム理解を支援するコンセプトキーワードの自動抽出法ckTF/IDF法の提案(テスト技法・保守技術,ソフトウェア工学の理論と実践)
- 中レベル抽象・薄い中間層・追跡性の実践によるコンパクトな教育用オペレーティングシステムudosの設計と実装(ソフトウェア工学)
- デバッグ情報を用いたC++用コールグラフ生成系 : 軽量なバイナリレベル型解析による仮想関数呼び出しの検出
- デバッグ情報を用いたC++用コールグラフ生成系軽量なバイナリレベル型解析による仮想関数呼び出しの検出
- シグナルにおけるデータ競合の検出
- プログラム理解に役立つ識別子からの"コンセプトキーワード"抽出法
- プログラム理解に役立つ識別子からの"コンセプトキーワード"抽出法
- ACMLに基づくプログラム情報抽出システムの設計
- コンパクトなANSI CインタプリタXCIの設計と実装
- XMLを用いたANSICのためのCASEツールプラットフォーム(ソフトウェアシステム)
- ウィンターワークショップ・イン・石垣島参加報告(会議報告)
- C言語用CASEツールへのDWARF2デバッグ情報の応用(サイバー増大ページ論文概要,新しいソフトウェアの実現,サイバー増大号)
- 構造指向型システムのための実行可能な仕様記述言語
- 第27回ソフトウェア工学国際会議(ICSE2005)参加報告(会議報告)
- オブジェクト指向属性文法OOAGのソフトウェア開発環境への応用
- オブジェクト指向属性文法OOAGと高階属性文法のレコード計算による形式化
- 特集「ソフトウェア論文」の編集にあたって
- 「21世紀のソフトウェア工学」の編集にあたって (21世紀のソフトウェア工学)
- 競合回避機構を備えた高互換かつ高精度な境界検査手法
- 誤解放を防ぐための新しい型修飾子strict_lifetime(ソフトウェア工学)
- ネイティブアセンブリコードを出力する教育用コンパイラ(XCC)と,水平スライスが可能な可視化ツール(MieruCompiler)
- PCTEを用いたUNIXコマンドデータベースの作成
- ネイティブアセンブリコードを出力する教育用コンパイラ(XCC)と,水平スライスが可能な可視化ツール(MieruCompiler)(ソフトウェア工学)
- 特集「ソフトウェア工学」の編集にあたって
- GPUを利用したポインタ解析の実装と評価
- Cプログラムの割込み競合の動的検出法 (特集 未来志向のソフトウェア工学)
- C言語初学者向けツールC-Helperの予備評価(奨励講演)
- C言語初学者向けツールC-Helperの予備評価(奨励講演)
- 特集「ソフトウェア工学」の編集にあたって
- 特集「ソフトウェア工学」の編集にあたって