距離マトリクス画像のハフ変換を用いた単語音声区間検出(ポスターセッション,第10回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
本報告では,入力音声と標準パターンを両軸とし,交点座標における距離値をピクセルの明るさで表現した距離マトリクス画像をハフ変換することで得られる直線から,単語音声区間を推定する手法を提案する.認識対象となる単語音声の前後に認識対象外の音声が付加されている場合,従来は連続DPや連続音素認識などを応用してワードスポッティングを行う方法が提案されてきたが,入力音声長が長くなると計算量が爆発的に増大することが問題となっていた.本研究では,発話音声中に認識対象単語が含まれていると,距離マトリクス画像中に,距離の近い領域が直線状に現れることを利用し,これを画像のハフ変換により直線として検出するとともに,検出された直線から音声の始端と終端を得る方法を提案する.本方式を用いて,100都市名の区間検出実験を行った結果,対象音声区間の始端の検出誤差が最大で120ms,終端の誤差は最大で70msであることを確認し,認識精度を落とすことなく,計算時間を低減できる本手法の有効性を検証した.
- 一般社団法人情報処理学会の論文
- 2008-12-02
著者
関連論文
- 平成20年度 社団法人日本外科学会通常総会
- デュアル入力レベル法(DINPLE法)を用いたオフィス環境における音声の収録(ライフログ活用技術,オフィス情報システム,マルチメディアシステム,マルチメディア通信,IP放送/映像伝送,一般)
- 腹腔鏡下脾臓摘出術を施行した遊走脾の1例
- 1314 大腸癌脾転移の3手術例
- 437 頚部食道胃管吻合部の狭窄および縫合不全に対し食道ステントが奏功した2例
- 279 大腸低分化腺癌手術症例の検討 : 病理組織学的因子に関して
- 左腕頭静脈直下に局在した成熟型嚢胞性奇形腫に対し胸骨挙上法を併用し, 縦隔鏡および胸腔鏡下に切除した1例
- 示II-434 他疾患に併存したPorto-Systemic shuntの4例 : 手術前後の血流動態と肝機能の検討
- R-10 右開胸開腹連続切開法による胸部食道癌根治術
- 子宮転移巣摘出術後に診断された乳癌の1例
- V-119 前縦隔腫瘍に対するラパロリフトを用いた胸骨挙上式縦隔鏡下手術
- 示II-262 大腸癌肝転移症例における胆汁CEA値の検討
- 6 膵頭部動静脈奇形による十二指腸潰瘍からの出血に対し緊急幽門輪温存膵頭十二指腸切除術を施行した1例
- 有茎空膓を用いた食道再建に際しmicrosurgeryによる血管吻合の有用性について
- II-218 傍大動脈リンパ節転移に5 -DFURが奏功した胃癌と大腸癌の2例
- 示I-367 胆嚢癌と慢性胆嚢炎の鑑別困難症例の検討(第52回日本消化器外科学会総会)
- 示I-29 食道肺瘻に対してcovered EMS挿入後に根治手術を施行し得た食道癌の一例(第52回日本消化器外科学会総会)
- 後腹膜原発の明細胞腺癌の1例
- P-778 リンパ節転移陽性乳癌の予後因子 : リンパ節転移状況からの検討
- 甲状腺癌における術前FNAを用いたDNA分析と予後評価の可能性
- I-53.当科における腹腔鏡下胆嚢摘出術に伴う術中胆道損傷の検討(第27回日本胆道外科研究会)
- リンパ節転移陽性乳癌における術後再発の予測 : 再発予知の重回帰式より
- 大動脈二尖弁に伴う大動脈弁閉鎖不全症に対する大動脈弁形成術の1手術例
- 個人のコンテキスト情報に基づく動的多重帰属グループサービスの提案
- 指紋隆線方向分布とマニューシャ対応付けを用いた指紋照合(画像処理,画像パターン認識)
- ストローク間の距離情報と構造情報とを用いた変型の大きい文字のオンライン認識
- 有効範囲付テンプレート追加登録法による認識辞書の学習
- 統計的手法と神経回路の結合による高精度多字種認識
- 一方向性関数による不可逆なバイオメトリクス登録情報を用いた個人認証
- 拡張外郭方向寄与度特徴と輪郭特徴とを用いた手書き漢字/非漢字のハイブリッド認識
- A-7-9 身体的特徴を用いた遠隔個人認証方式の一提案
- GAT反復を用いたアフィン変換不変の濃淡文字相関法
- 有効範囲付テンプレート追加登録法による辞書学習
- 部分空間法と神経回路の階層構成による類似文字識別
- 携帯型ペン入力インタフェース用個人辞書の学習
- 拡張PDC特徴を用いた手書き漢字認識ソフトウェア
- 16)ハンディ型パーソナルペン入力インタフェース(ヒューマンインフォメーション研究会)
- ハンディ型パーソナルペン入力インタフェース
- 音声認識型電話秘書システムを指向したワードスポッティングに関する検討(一般,ライフログ活用技術,オフィス情報システム,情報通信マネジメント,一般)
- デュアル入力レベル法 (DINPLE法) を用いたオフィス環境における音声の収録
- デュアル入力レベル法(DINPLE法)を用いたオフィス環境における音声の収録(オフィス情報システム,ライフログ活用技術,オフィス情報システム,マルチメディアシステム,マルチメディア通信,IP放送/映像伝送,一般)
- デュアル入力レベル法(DINPLE法)を用いたオフィス環境における音声の収録(オフィス情報システム,ライフログ活用技術,オフィス情報システム,マルチメディアシステム,マルチメディア通信,IP放送/映像伝送,一般)
- 音声認識を適用した電話秘書システムに関する一考察(システム)
- 距離マトリクス画像のハフ変換を用いた単語音声区間検出(ポスターセッション,第10回音声言語シンポジウム)
- 距離マトリクス画像のハフ変換を用いた単語音声区間検出(ポスターセッション,第10回音声言語シンポジウム)
- 距離マトリクス画像のハフ変換を用いた単語音声区間検出(ポスターセッション,第10回音声言語シンポジウム)
- 入力一標準パターン距離マトリクス画像の分析とワードスポッティングへの応用(合成,生成,韻律,一般)
- 始終端特徴パラメータの線形結合による調音結合の分析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 始終端特徴パラメータの線形結合による調音結合の分析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 始終端特徴パラメータの線形結合による調音結合の分析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 特定話者音節HMMの標準偏差補正と無音削除処理による認識率改善(第8回音声言語シンポジウム)
- 特定話者音節HMMの標準偏差補正と無音削除処理による認識率改善(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 特定話者音節HMMの標準偏差補正と無音削除処理による認識率改善(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音声対話システムにおける発話促進プロンプト送出タイミング設計法(音声, 聴覚)
- 同時性食道胃重複癌の検討
- OK-432とミノサイクリンの胸腔内投与が有効であった食道癌切除後の乳糜胸の1例
- ニューラルネットを用いた特徴修正によるフィードバック型文字認識
- 変動した特徴を学習するニューラルネット
- 距離マトリクス画像からの直線検出にもとづく電話会話ログ検索 (ライフインテリジェンスとオフィス情報システム)
- 距離マトリクス画像からの直線検出にもとづく電話会話ログ検索
- 二度書き/ストローク切れにロバストなオンライン文字認識
- 「遺伝的アルゴリズムを用いた類似文字識別のための特徴選択
- 相反する2方向の特徴変位を学習するニューラルネットによる特徴修正を用いた文字認識(画像認識,コンピュータビジョン)
- SY-6-4 重症心不全における再生型治療の基礎研究およびその臨床応用(SY-6 シンポジウム(6)明日の外科医療を構築するための基礎研究,第111回日本外科学会定期学術集会)
- PS-116-3 糖尿病患者のCABGの遠隔成績(PS-116 ポスターセッション(116)心臓:手術-1,第111回日本外科学会定期学術集会)
- PS-118-3 電気的統合性からみたiPS細胞由来心筋細胞シートによる心筋再生効果の検討(PS-118 ポスターセッション(118)心臓:基礎,第111回日本外科学会定期学術集会)
- SF-067-3 重症心不全における新しい細胞移植法の検討 : 細胞シートと大網を用いた大量細胞移植法(SF-067 サージカルフォーラム(67)心臓:基礎,第111回日本外科学会定期学術集会)
- SF-066-3 冠動脈バイパス術後の開心術 : 成績向上を目指して(SF-066 サージカルフォーラム(66)心臓:手術-2,第111回日本外科学会定期学術集会)
- 距離マトリクス画像からの直線検出にもとづく電話会話ログ検索(ログ活用・情報検索,グループウェアとネットワーク,ライフログ活用技術,一般)
- 電話会話ログ検索向け距離マトリクス画像からの直線検出法 (ライフインテリジェンスとオフィス情報システム)
- 距離マトリクス画像中からの直線検出によるワードスポッティング(LD-DMI法)を用いた電話会話ログ検索(音声検索,第13回音声言語シンポジウム)
- 距離マトリクス画像中からの直線検出によるワードスポッティング(LD-DMI法)を用いた電話会話ログ検索(音声検索,第13回音声言語シンポジウム)
- 電話会話ログ検索における再現率と適合率による評価法の検討(ライフログ,情報セキュリティ,ライフログ活用技術,ライフインテリジェンス,オフィス情報システム,一般)
- 電話会話ログ検索における再現率と適合率による評価法の検討(ライフログ,情報セキュリティ,ライフログ活用技術,ライフインテリジェンス,オフィス情報システム,一般)
- 電話会話ログ検索における距離マトリクス画像の2値化しきい値制御(ライフログ,ライフログ活用技術,オフィス情報システム,情報通信マネジメント,一般)
- 電話会話ログ検索における距離マトリクス画像の2値化しきい値制御(ライフログ,ライフログ活用技術,オフィス情報システム,情報通信マネジメント,一般)
- 電話会話ログ検索における距離マトリクス画像の2値化しきい値制御
- 電話会話ログ検索における距離マトリクス画像の2値化しきい値制御
- WS-8-3 肺移植手術における気管・気管支,肺動脈の再建・形成手技の一般呼吸器外科手術への応用(WS-8 ワークショップ(8)肺移植の手術手技から学ぶ一般呼吸器外科への応用)
- PS-108-8 Nipro LVADから埋め込み型LVADへのconversionの有用性の検討(PS-108 心臓 その他,ポスターセッション,第112回日本外科学会定期学術集会)
- PS-107-3 透析症例に対する冠動脈バイパス術の手術成績の検討(PS-107 心臓 虚血性疾患,ポスターセッション,第112回日本外科学会定期学術集会)
- PS-107-1 冠動脈バイパス手術遠隔期成績の検討(PS-107 心臓 虚血性疾患,ポスターセッション,第112回日本外科学会定期学術集会)
- SF-105-6 僧帽弁手術に伴う心房細動に対するMaze手術後のペースメーカー植え込みの危険因子の検討(SF-105 サージカルフォーラム(105)心臓,第112回日本外科学会定期学術集会)
- SF-105-5 慢性透析症例に対する大動脈弁置換術の術前リスク評価 : JapanSCOREの有用性の検討(SF-105 サージカルフォーラム(105)心臓,第112回日本外科学会定期学術集会)
- VWS-1-2 機能性僧帽弁逆流症に対する弁形成術及び乳頭筋間縫縮術 : 心臓CT/MRIによる検討(VWS-1 ビデオワークショップ(1)機能的僧帽弁逆流に対する術式の工夫,第112回日本外科学会定期学術集会)
- VSY-6-4 遠隔成績向上を目指した自己弁温存大動脈基部置換術(reimplantation法)における至適人工血管選択(VSY-6 ビデオシンポジウム(6)大動脈弁形成術および大動脈弁温存手術-適応と術式-,第112回日本外科学会定期学術集会)
- 距離マトリクス画像中からの直線検出によるワードスポッティング(LD-DMI法)を用いた電話会話ログ検索
- 電話会話ログ検索における再現率と適合率による評価法の検討
- 距離マトリクス画像中からの直線検出によるワードスポッティング(LD-DMI法)を用いた電話会話ログ検索
- 電話会話ログ検索における再現率と適合率による評価法の検討
- 電話会話ログ検索向け距離マトリクス画像からの直線検出法(ログ検索とユーザ認証,情報のシステム間流通と信頼性,ライフログ活用技術,オフィス情報システム,一般)
- 距離マトリクス画像からの直線検出にもとつく電話会話ログ検索手法の提案と評価(ライフログ活用技術,オフィス情報システム,ビジネス管理,一般)
- 距離マトリクス画像からの直線検出にもとつく電話会話ログ検索手法の提案と評価(ライフログ活用技術,オフィス情報システム,ビジネス管理,一般)
- 音情報を用いたお年寄り見守りシステムの検討(ライフログ活用技術,オフィス情報システム,ビジネス管理,一般)