13-4 感情制御用音声データの評価(第13部門 メディア工学(映像処理))
スポンサーリンク
概要
- 論文の詳細を見る
To develop emotional speech synthesis technology for sound broadcasting services, listening test judging emotion of speech data was conducted. The results show that about 300 data can be available to formulate the rule of controlling emotional characteristics of speech by extracting the data with more than 70% answered correctly.
- 2013-12-18
著者
-
今井 篤
NHKエンジニアリングサービス
-
世木 寛之
日本放送協会放送技術研究所
-
清山 信正
日本放送協会放送技術研究所
-
世木 寛之
Nhk放送技術研究所 (人間・情報科学)
-
都木 徹
NHKエンジニアリングサービス
-
今井 篤
日本放送協会
-
都木 徹
NHKエンジニアリングシステム
-
世木 寛之
日本放送協会
-
清山 信正
日本放送協会
-
今井 亨
日本放送協会
関連論文
- ニュース番組の収録音声を利用した波形接続型音声合成システム
- コンテンツ活用のための報道番組自動書き起こしシステム(音声システム,システム開発論文)
- 高品質な株価音声合成装置の開発とデジタルラジオ放送での試験運用(放送現業・コンテンツ制作)
- 中継などの様々な音響下でのニュース音声認識
- 音楽聴取体験の感動評価の要因とその個人差に関する検討(スペシャルセッション : 究極の超臨場感 (1))
- フィルターバンクサブトラクションによる雑音環境下の音声認識 (音声認識による字幕サービス 特集号)
- 連続音声認識における動的特徴量の高精度な計算法
- 音声認識における高精度な動的特徴量計算法の提案
- 音声認識における高精度な動的特徴量計算法の提案
- 音声認識における高精度な動的特徴量計算法の提案
- ニュース番組の収録音声を利用した波形接続型音声合成システム
- 音楽聴取における"感動"の評価要因----感動の種類と音楽の感情価の関係
- 音声認識を利用した放送用ニュース字幕制作システム
- 混合正規分布型HMMにおける混合数の増加法の検討
- 連続音声認識のためのスタックデコーダの作成
- 2段階クラスタリングを用いた適応化音響モデルの学習
- ニュース音声認識システム(音声処理技術のデモの紹介)
- 韻律の視覚化及び矯正音声を用いた中国語学習システム(教育学習支援システム, システム開発論文)
- 2段階クラスタリングに基づく選択学習による音響モデル適応化
- 高品質リアルタイム話速変換システムの開発
- ニュース音声を対象にした時間遅れを蓄積しない適応形話速変換方式
- 高齢者を対象とした話速変換音声の評価実験
- 話速変換音声の自然性向上について -無声区間の伸縮-
- リアルタイム話速変換装置とその応用 : デモンストレーション
- リアルタイム話速変換装置とその応用 : デモンストレーション
- 単語知覚における話者映像と時間伸長音声のずれの検知限および許容限
- 語彙間の主観的な類似度による感動語の分類 (音の聴こえと認知 特集号)
- 語彙間の主観的な類似度による感動語の分類
- 別話者音素による部分置換音声の自然性とスペクトル特徴量について(聴覚・音声・言語とその障害,一般)
- 高齢者の聴覚補助機能を搭載したラジオおよびテレビ受信機の開発 (音の聴こえと認知 特集号)
- 類似文節の韻律パターンを直接引用する際の時間長補正手法の検討
- 話速変換技術を利用したインタネットでのラジオニュースサービス(放送現業・コンテンツ制作)
- 話速変換技術を利用したインターネットでのラジオニュースサービス (音響信号処理 特集号)
- 高品質な音声合成 ('04〔NHK〕技研公開 講演・研究発表 特集号(2))
- リアルタイムニュース字幕修正作業のための音声認識誤り自動検出法(ヒューマンインフォメーション)
- 可変長の音素環境依存音素列を単位とする波形接続型音声合成(合成, 韻律, 生成, 一般)
- ニュース番組の収録音声を利用した高品質な音声合成のための素片選択法(聴覚・音声/一般)
- 聴取補助機能を備えたラジオの開発(福祉と言語処理, 一般)
- 聴取補助機能を備えたラジオの開発(福祉と言語処理,一般)
- 聴取補助機能を備えたラジオの開発(福祉と言語処理, 一般)
- 短いフレーム間隔による連続音声認識の検討
- スポーツニュースを対象とした音声認識の検討
- ゆっくり話せば話がはやい : 話速変換技術(五感メディア,映像/音声サービスの品質,ワイヤレスネットワークの品質,次世代ネットワークアーキテクチャ,一般)
- リアルタイムニュース字幕修正作業のための音声認識誤り自動検出法 (音声認識による字幕サービス 特集号)
- ニュース音声を対象にした時間遅れを蓄積しない適応形話速変換方式--時間が伸びずにゆっくり聞ける (人にやさしい技術特集号)
- 音声合成のためのテンプレートを用いた録音文セット生成システムとラジオ番組「気象通報」への適用について
- 音楽聴取における「感動」の評価要因--感動の種類と音楽の感情価の関係 (音響 特集号--スーパーハイビジョン音響の収音・再生と評価)
- 音響情報に基づく音声認識誤り検出法の精度向上に関する検討
- 9-2 音声認識自動字幕化システムにおける修正支援方法 : 色付けによる誤り候補の呈示効果
- 8-7 映像の可変速度再生に同期した聞きやすい音声の再生システム
- A-15-8 ニュース字幕放送における音声確認の修正支援システム
- 音声認識結果からのTTSを用いた認識誤り自動検出の検討
- ニュース番組における認識率変動要因の検討
- GMMによる音響モデル用学習データの自動選択
- 状態共有トライフォンHMMとtied-mixture HMMのモデル構造の比較
- フィルタバンク・サブトラクションを用いたニュース番組現場リポート音声の認識
- フィルタバンク・サブトラクションを用いたニュース番組現場リポート音声の認識
- フィルタバンク上でのスペクトルサブトラクションを用いた中継音声の認識
- BS-8-2 再生音楽の感動評価から考えるユーザ体験品質(BS-8.Beyond QoS/QoE(2):聴覚的コミュニケーションにおけるユーザ体験としての臨場感/超臨場感,シンポジウムセッション)
- ニュース音声認識結果のリアルタイム修正装置
- 別話者音素による部分置換音声の自然性とスペクトル特徴量について
- 株価音声合成システムのデジタルラジオ放送での試験運用について
- 状態共有トライフォンHMMの学習における決定木とモデル数の検討
- 音声認識によるリアルタイム字幕放送の進展
- 選択学習による音響モデルの適応化 (音声認識による字幕サービス 特集号)
- 現場リポートニュース音声へのクラスタ依存音響モデルの適用
- ポ-タブル話速変換器の開発 (特集 ′98技研公開講演・研究発表会)
- 実用に近づいたリアルタイム話速変換器
- 高齢者向けミキシングバランスメータ(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- 高齢者向けミキシングバランスメータ(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- 音声/非音声区間切替による背景音抑圧処理法の検討(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- 音声/非音声区間切替による背景音抑圧処理法の検討(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- SP2000-11 話者クラス音響モデルのための学習データの自動選択手法
- 中継などの様々な音響下でのニュース音声認識
- 字幕制作のためのオンライン発話検出と男女並列音声認識 (音声処理特集号)
- 株式市況音声合成システムの開発 (音声処理特集号)
- 速聴トレーニングによる速読速度の向上について
- 高齢者のための音響処理技術
- 話速変換技術・音声変換技術の放送および関連ビジネスへの応用
- 7-8 視覚障がい者に好ましい高速音声提示方法に関する研究(第7部門 ヒューマンインフォメーション1)
- 2-10 定型文を音声合成するための録音文章作成手法の検討(第2部門 メディア処理2)
- 7-9 放送用単語合成音声作成編集ツールの検討(第7部門 マルチメディアフレームワーク)
- 2-2 視覚障害者向け地震・津波緊急文字スーパーの自動読み上げ方式に関する一検討(第2部門 放送技術(放送現業))
- 1-8 単語音声合成における話者混合データベース利用の一検討(第1部門 メディア工学1)
- 8-8 ラジオ放送への利用を目的とした株価音声合成装置(第8部門 放送技術(放送方式,放送現業,無線・光伝送))
- 7-12 録音編集型音声合成における休止時間長設定および時間長調整方法(第7部門 マルチメディア・ヒューマンインタフェース)
- 1-2 単語音声内における局所的な別話者音素入れ替えによる個人性や自然性への影響(第1部門 音声処理・セキュリティ)
- 22-4 話速変換を利用したインターネットでのラジオニュースサービス(第22部門 放送現業II)
- 1-1 音声合成における発話速度の制御規則に関する研究(第1部門 音声処理・セキュリティ)
- マルチ音素クラスのベイズ情報量基準に基づくオンライン話者ダイアライゼーション(音声,聴覚)
- 高齢者にとって放送の音声を聴き易くする技術
- 12-13 自然発話音声を対象にした聞きやすい高速話速変換技術(第12部門 ヒューマンインフォメーション2)
- 視覚障がい者の情報取得を支援する,聴きとりやすい高速音声再生技術(福祉と音声処理,一般)
- 視覚障がい者の情報取得を支援する,聴きとりやすい高速音声再生技術(福祉と音声処理、一般)
- 4. 高齢者のための音響処理技術(福祉用途の映像・音響・触覚技術)
- 13-4 感情制御用音声データの評価(第13部門 メディア工学(映像処理))
- 雑音下の音声明瞭性に対するスペクトルエネルギー再配分の効果(安全・安心な社会を創る音声・聴覚情報処理,音声/福祉/ディジタル信号処理/聴覚一般)
- 高齢者に適した番組音調整装置の開発 : 家庭内で聞きとりやすい受信機を目指して(安全・安心な社会を創る音声・聴覚情報処理,音声/福祉/ディジタル信号処理/聴覚一般)
- 高齢者に適した番組音調整装置の開発 : 家庭内で聞きとりやすい受信機を目指して(安全・安心な社会を創る音声・聴覚情報処理,音声/福祉/ディジタル信号処理/聴覚一般)
- 雑音下の音声明瞭性に対するスペクトルエネルギー再配分の効果(安全・安心な社会を創る音声・聴覚情報処理,音声/福祉/ディジタル信号処理/聴覚一般)