音声CAPTCHAシステムにおける削除法と混合法の比較(福祉と音声処理,一般)
スポンサーリンク
概要
- 論文の詳細を見る
音声聴取課題によって対象者が人間であるか機械であるかを判別する音声CAPTCHAシステムが視覚障害を持つ人々のために提供されている.既存システムの主流である「混合法」は聞き取らせたい音声に雑音を重畳して自動音声認識を妨害する.これに対して我々は,音韻修復効果(垣根効果)を用いた「削除法」を提案しており,マスク比率のみによって難易度を制御できるという利点がある.我々は「機械と人間の能力差を大きくする」というCAPTCHA課題の普遍的な設計方針に基づきつつ,「人間による解答のしやすさ」も考慮した「混合法」と「削除法」の比較評価を目指している.本稿では,音声認識性能,人間にとっての了解度,心的負荷などに関して,予備実験の結果に基づく仮説を提示し,今後の実験計画について述べる.
- 2009-10-22
著者
関連論文
- 音楽知識に基づく音高・音長の組合せ特徴量を用いたMIDIデータからの作曲家判別(音楽解析)
- 文字構造の文法記述に基づくオンライン手書き漢字列認識(テーマセッション4,文字・文書の認識・理解)
- 日本語歌詞からの自動作曲(音楽とOR)
- テンポ曲線と隠れマルコフモデルを用いた多声音楽MIDI演奏のリズムとテンポの同時推定(演奏認識/合成,便利で身近な音楽情報処理)
- ラジオ放送番組におけるスポーツ実況中継の分析(視覚障害/聴覚障害,一般)
- ラジオ放送番組におけるスポーツ実況中継の分析
- 調波音・打楽器音分離手法を用いた音楽音響信号からの自動和音認識(音響分析一般(2))
- Orpheus : 歌詞の韻律に基づいた自動作曲システム(自動作曲)
- 早口合成音声の聴取実験によるテキスト音声合成の評価(視覚障害/聴覚障害/一般)
- 視覚障害者の聴覚認知の解明と音声対話への利用に向けて(ヒューマンコミュニケーショングループ (HCG) シンポジウム)
- 対面朗読者と視覚障害者の対話の分析とその応用(セッション3 : 理解るインタフェース : 音声対話)
- 対面朗読者と視覚障害者の対話の分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- JavaScript を利用した動的な Web のアクセシビリティ
- JavaScriptを利用した動的なWebのアクセシビリティ
- ユーザテストをベースとしたウェブ・アクセシビリティ問題(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- Webコンテンツ・アクセシビリティガイドラインWCAG 2.0の概要とWebアクセシビリティ向上
- Web 構造化のユーザビリティとアクセシビリティ効果
- Web構造化のユーザビリティとアクセシビリティ効果(特定領域研究「情報福祉の基礎」)
- 写真を音声でわかりやすく説明する方法
- HP-1-5 ラジオ放送支援システム「オラビー」の開発(HP-1.放送メディアにおける福祉情報の現状と可能性,パネル討論,ソサイエティ企画)
- モルフォロジ収縮処理と構造特徴複製に基づく画像インペインティング(一般セッション,手,顔,身体表現の認識,理解)
- モルフォロジ収縮処理と構造特徴複製に基づく画像インペインティング(一般セッション2)
- 4.インターネットと音声合成(バリアフリー社会に向けた音声情報処理)
- 音声CAPTCHAシステムにおける削除法と混合法の比較(福祉と音声処理,一般)
- 超早口音声の聴取における単語親密度の教示効果
- 音韻修復効果を用いた音声CAPTCHAの検討
- 音韻修復効果を用いた音声CAPTCHAの検討(高齢者の認知機能保障技術及び一般)
- 超早口音声の聴取における単語親密度の教示効果(高齢者の認知機能保障技術及び一般)
- 第46回ヒューマンインタフェース学会研究会報告
- 探索的検索のための音声入力インタフェースの検討
- マルコフ確率場を用いた調認識、自動和声付け、および自動対位法
- 調波時間構造化クラスタリング(HTC)による音楽音響特徴量の同時推定
- 7. 擬人化音声対話エージェント(音声情報処理技術の最先端)
- 音声CAPTCHAシステムにおける削除法と混合法の比較(福祉と音声処理,一般)
- 調波構造・時間包絡・音色の統合的クラスタリングによる楽音分析(音楽音響信号処理 (2))
- ハーモニッククラスタリングと情報量規準による音楽の音高/音源数の推定(山下記念研究賞受賞記念講演)
- Specmurtにおける凖最適共通調波構造パターンの反復推定による多声音楽信号の可視化とMIDI変換(音楽音響信号認識)
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(第5回音声言語シンポジウム : ポスターセッション)
- ハーモニック・クラスタリングによる多重音信号音高抽出における音源数とオクターブ位置推定(音楽音響信号認識/生成1)
- ハーモニック・クラスタリングによる多重音の基本周波数推定アルゴリズム
- ハーモニッククラスタリングによる多重音の基本周波数推定
- 歌唱曲自動作曲の需要と今後 - 2年間のOrpheus運用を通じて
- 単旋律と和音の確率モデルの組み合わせによるピアノ曲演奏の自動表情付け
- 非和声音規則に基づく経路制約を用いた旋律自動生成
- 第53回WIT研究会におけるリアルタイム映像配信の報告
- 単旋律と和音の確率モデルの組み合わせによるピアノ曲演奏の自動表情付け
- 音声認識読み記号および音声関連ソフトウエアに係わる用語の試行標準案
- 歌唱曲自動作曲の需要と今後 : 2年間の Orpheus 運用を通じて
- 複素スペクトル円心(CSCC)の推定に基づくマイクロホンアレーによる雑音抑圧
- 複素スペクトル円心(CSCC)の推定に基づくマイクロホンアレーによる雑音抑圧
- モルフォロジ収縮処理と構造特徴複製に基づく画像インペインティング(一般セッション,手,顔,身体表現の認識,理解)
- 動的計画法に基づく自動対位法
- 動的計画法と音列出現確率を用いた対位法の対旋律の自動生成(音楽生成・システム)
- 確率モデルによる多声楽曲MIDI演奏からの楽譜推定
- 音声インタフェースのための対話負荷測定法(音声,聴覚)
- モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索(IBIS2010(情報論的学習理論ワークショップ))
- 擬人化音声対話エージェントにおける視線制御方法の検討
- 音声対話における擬人化エージェントの利用効果の検討
- ISO/IEC MPEG-4 Audio Lossless Coding (ALS)におけるチャネル内とチャネル間の長期予測(国際標準に向けたテレコム技術とその効用論文)
- 多チャンネル時系列信号のロスレス符号化
- チャネル間相関を用いた多チャネル信号の可逆圧縮符号化(産学連携論文)
- 早口音声の聴取訓練における単語親密度の影響(一般(ポスターセッション),第9回音声言語シンポジウム)
- 早口音声の聴取訓練における単語親密度の影響(一般(ポスターセッション),第9回音声言語シンポジウム)
- 早口音声の聴取訓練における単語親密度の影響(一般(ポスターセッション),第9回音声言語シンポジウム)
- 早口音声聴取における単語親密度と学習効果の検討
- 早口音声聴取における単語親密度と学習効果の検討
- 確率文脈自由文法を用いた和声学規則の表現と楽曲の自動和声解析(表情付け・分析)
- 確率文脈自由文法を用いた和声学規則の表現と楽曲の自動和声解析(表情付け・分析)
- 確率モデルによる多声音楽演奏のMIDI信号のリズム認識(音楽情報科学)
- リズム語彙を用いたHMMによるMIDI演奏のリズムとテンポ推定
- ストローク単位の確率文脈自由文法を用いたオンライン手書き数式データベースの作成(テーマセッション4(数式),文字・文書の認識・理解)
- HMMによるMIDI演奏の楽譜追跡と自動伴奏
- 音声インタフェースにおける認知的負荷測定法とその評価
- パート除去を目的とした楽譜と音響信号のアラインメント手法の検討(音楽音響信号処理 (1))
- リズムベクトルを用いたMIDI演奏データからのテンポの変動の推定(音楽音響信号認識/生成2)
- ラジオ放送支援システム「オラビー」の開発
- フレームごとのモデル合成による残響下音声認識(ポスターセッション)(第5回音声言語シンポジウム)
- フレームごとのモデル合成による残響下音声認識(第5回音声言語シンポジウム : ポスターセッション)
- フレームごとのモデル合成による残響下音声認識(第5回音声言語シンポジウム : ポスターセッション)
- フレームごとのモデル合成による残響下音声認識
- 球面上非対称2chアレイによる全方位音源定位(聴覚・音声・言語とその障害,一般)
- HMMを用いたオフライン手書き単語認識における環境クラスタリングとGMMの同時最適化(テーマセッション,文字・文書の認識と理解)
- ラジオ放送支援システム「オラビー」の開発(高齢者支援,一般)
- 音声入力への応答タイミング決定のための強化学習の検討(音声一般・障害者支援,聴覚・音声・言語とその障害/一般)
- Specmurt分析とChroma Vectorを用いたHMMによる音楽音響信号の調認識
- 視覚障害者用早口合成音声による慣れの効果(福祉と音声処理, 一般)
- 視覚障害者用早口合成音声による慣れの効果(福祉と音声処理, 一般)
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(ポスターセッション)(第5回音声言語シンポジウム)
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(第5回音声言語シンポジウム : ポスターセッション)
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定
- 早口合成音声に対する高齢者の慣れ
- 対話分析に基づく視覚障害者用音声対話システム
- 早口合成音声に対する高齢者の慣れ(特定領域研究「情報福祉の基礎」)
- 対話分析に基づく視覚障害者用音声対話システム(特定領域研究「情報福祉の基礎」)
- 状態分割と分布の畳み込みを用いる残響音声のためのモデル適応
- 楽譜情報からの作曲家らしさ認識のための音楽特徴量の提案
- 音響モデル変換による残響環境中の音声認識
- HMMと音符連鎖確率を用いた旋律への自動和声付け
- 効率的なパラメータ共有を用いた環境依存HMMによるオフライン手書き単語認識(画像認識,コンピュータビジョン)
- 効率的なパラメータ共有を用いた環境依存HMMによるオフライン手書き単語認識