韻律に寄与する音響特徴量を用いた聞きやすい高速話速変換技術
スポンサーリンク
概要
- 論文の詳細を見る
We have developed an intelligible high-speed speech rate conversion technology using the acoustic feature quantities that contribute to prosody. In contrast to the conventional method, which plays back accelerated speech at the same uniform rate from the beginning to end, our proposed approach varies the playback rate adaptively on the basis of acoustic detection of the position of an utterance and any fluctuations in a speaker's fundamental frequency (F0) and power. In so doing, we hope to make high-speed playback easier to listen to by providing the listener with a "slowed-down" playback effect. Since this approach converts speech rate using just the acoustic features of audio data, it can be applied to not only Japanese but other languages as well. While the algorithm we developed in this study is optimized for the Japanese language, we aim to implement the proposed approach in a wider array of commercial devices and customize the technology to various languages.
著者
-
伊福部 達
東京大学 先端科学技術研究センター
-
田中 敏明
東京大学 先端科学技術研究センター
-
岩鼻 幸男
財団法人nhkエンジニアリングサービス
-
都木 徹
Nhk 放送技研
-
田澤 直幸
財団法人NHKエンジニアリングサービス
-
清山 信正
NHK 放送技術研究所
-
今井 篤
NHK 放送技術研究所
-
伊福 部達
北海道大学応用電気研究所
-
都木 徹
NHK 放送技術研究所
関連論文
- 音声認識字幕における円滑な連携作業を実現するためのソフトウェア開発と情報保障者の技能
- 特別講演 「見る」「聴く」「話す」を助ける放送技術--感覚のナゾ解きから生まれたモノ ([NHK]技研公開2010 講演・研究発表 特集号(2))
- 呼気流による抑揚制御機能を備えたウェアラブル人工喉頭の試作
- 喉頭摘出者の発声を支援するウェアラブル人工喉頭の開発と評価
- 医療・福祉技術がもたらすもの--生きがいの倍増と社会保障費の削減 (特集 社会保障のあり方)
- TV4Uにおける高機能番組ブラウザの開発 : 新サービスの提供とユーザビリティを向上した"TVBrowser"(ITS画像処理,映像メディア及び一般)
- TV4Uにおける高機能番組ブラウザの開発 : 新サービスの提供とユーザビリティを向上した"TVBrowser"(新サービス,ITS画像処理,映像メディア及び一般)
- 教員練習科の設置から盲学校聾唖学校の分離令まで--「大阪聾口話学校創立一カ年口話成績」の復刻について
- ポインティング・デバイスで操作する発話支援インタフェース
- HI2002札幌大会
- 超視覚 : 音による「気配」の知覚
- 超感覚 : そのナゾ解きから生まれるモノ
- 盲人の障害物知覚 : 騒音制御への応用
- 招待講演 音による「気配知覚」
- 汎用点字ディスプレイ管理サーバに必要な機能要件の考察
- 高齢者の定量的下肢筋力評価のための膝間力計測器の開発
- 3E1-06 高齢者の身体機能計測と転倒予防の一方策(OS 身体機能・活動力の維持と向上)
- SDA法を用いた高齢者の姿勢制御能の解析
- ヘッド・アップ・ディスプレイ(HUD)による時空間MRズレの生体影響評価
- ヘッド・アップ・ディスプレイ(HUD)による時空間MRズレの生体影響評価(人工現実感)
- 発話補助機器の研究の動機とその後の進展
- 超音波メガネなど「音の福祉工学」の最前線
- 医学と工学の連携 : 「聴く」「話す」「読む」のを助けるために
- 高齢者の定量的下肢筋力評価のための膝間力計測器の開発
- ヘッド・アップ・ディスプレイ(HUD)による時空間MRズレの生体影響評価
- A-16-6 Python APEによるライブリソースからのコンテンツ生成に関する一検討(A-16.マルチメディア・仮想環境基礎,一般セッション)
- TV4Uにおける高機能番組ブラウザの開発 : 新サービスの提供とユーザビリティを向上した"TVBrowser"(新サービス,ITS画像処理,映像メディア及び一般)
- K-004 TV4Uにおける番組ブラウザの高度化(教育工学・福祉工学・マルチメディア応用,一般論文)
- A-16-14 ムービー配信型TV4Uシステムの構築(A-16. マルチメディア・仮想環境基礎,一般セッション)
- Amyotrophic Lateral Sclerosis (ALS) 者を対象とした継続的な意思伝達を支援する眼球運動入力デバイス
- 指先皮膚の機械特性を考慮した触覚ディスプレイ用圧電アクチュエータの製作
- 指先型触覚ディスプレイによって伝達される情報量
- 指で見る「夢」
- 空間相関関数(FSCC)に基づくデュアルMSマイクロフォンによる高臨場感ステレオフォニック収音
- 生体力学モデルに基づく触覚ディスプレイの設計
- 喉頭摘出者の発声を支援するウェアラブル人工喉頭の開発
- 視覚障害者への音声提示における最適・最高速度
- 超感覚のナゾ解きから生まれるもの (特集 「人と技術とAI」および一般)
- 座談会 新健康フロンティア戦略の推進に向けて (特集 新健康フロンティア戦略--健康国家への挑戦)
- 国際会議における聴覚障害者支援を目的とした音声字幕変換システムの設計
- デジタルコンテンツシンポジウムについて
- 1.第4回デジタルコンテンツシンポジウム報告(ディジタルコンテンツ制作の最新動向〜ここまで来たディジタルコンテンツ制作〜)
- 企業紹介 Pick up カンパニーシリーズ(第41回) 財団法人 NHKエンジニアリングサービス
- 第2回デジタルコンテンツシンポジウム報告(ディジタルコンテンツ制作を支える新技術)
- 定量的下肢筋力計測による虚弱高齢者のスクリーニング手法の開発
- 福祉工学の立場から視・聴覚機能を支援する--触覚利用を例にとって
- 非発音物体の聴知覚のための音響的手がかりの分析
- 聴覚障がい者のためのモバイル型遠隔情報保障システムの提案と情報保障者による評価
- SDA法を用いた姿勢制御能の加齢変化の解析
- 五感情報とバリアフリー : ふたつの価値観の両立をめざして(生活環境支援理学療法研究部会)
- 日本初の電気式補聴器「リッカフオン」について : 性能と装用時の聞こえ
- 日本初の電気式補聴器「リッカフオン」について : 修復と特性測定
- 日本初の電気式補聴器「リッカフオン」について : 加藤亨と聴話教育
- 加齢による認知機能の変化が高齢者のICT機器を用いた就労への意欲に及ぼす影響
- 福祉工学の夢(11)超腹話術のナゾ解きから生まれたモノ
- 福祉工学の夢(10)ヒトの耳をだます物まね鳥たち
- 福祉工学の夢(9)音声タイプライタの開発秘話
- 戦前の聾唖教育関係者の留学情報に関する一考察(2)大阪聾口話学校創立壹ヶ年口話成績(その3)
- 戦前の聾唖教育関係者の留学情報に関する一考察 : 大阪聾口話学校創立壹ヶ年口話成績」(その2)
- 福祉・介護テクノロジーにおける価値観の変容
- 福祉工学の夢(14)人工内耳の夜明け前
- 福祉工学の夢(13)蝋管音声の再生物語
- 福祉工学の夢(12)文字を持たなかったアイヌ民族秘話
- 福祉工学の夢(8)「トリだよ」と名乗ったインコの話
- 福祉工学の夢(7)指で見る「夢」
- 福祉工学の夢(6)「指で聴く」研究
- 福祉工学の夢(5)光と音はどちらが速いか?
- 福祉工学の夢(4)「盲パイ」研究から生まれたもの
- 福祉工学の夢(3)地震速報チャイムができるまで
- 福祉工学の夢(2)福祉工学への船出
- 福祉工学の夢(1)福祉工学から生まれるもの
- SDA法を用いた高齢者の姿勢制御能と転倒リスク評価
- 話速変換技術・音声変換技術の放送および関連ビジネスへの応用
- 手術器械の個体管理に利用可能なセラミック型RFIDの基礎的検証
- 視覚障がい者の情報取得を支援する,聴きとりやすい高速音声再生技術 (福祉情報工学)
- 視覚障がい者の情報取得を支援する,聴きとりやすい高速音声再生技術 (音声)
- 福祉工学の夢(19)「コウモリ」になり切ってみて
- 7-8 視覚障がい者に好ましい高速音声提示方法に関する研究(第7部門 ヒューマンインフォメーション1)
- 韻律に寄与する音響特徴量を用いた聞きやすい高速話速変換技術
- 福祉工学の夢(21)掃除ロボット「ヤン坊」の働きぶり
- 福祉工学の夢(20)「気配」の正体
- 福祉工学の夢(18)ある全盲研究者の「速聴」の話
- 福祉工学の夢(16)3Dテレビの苦悩
- 福祉工学の夢(15)「人工の目」が見る夢
- 寡黙なVRにも耳を!
- 新学会誌委員長の四つの思い
- To get out of orphan products of barrier-free technologies
- 12-13 自然発話音声を対象にした聞きやすい高速話速変換技術(第12部門 ヒューマンインフォメーション2)
- 1. 5th Digital Content Symposium
- Hand with sensory feedback.
- 4. 高齢者のための音響処理技術
- 1. デジタルコンテンツシンポジウムについて(ディジタルコンテンツ制作の最新動向 〜ここまで来たディジタルコンテンツ制作〜)
- 視覚障がい者の情報取得を支援する,聴きとりやすい高速音声再生技術(福祉と音声処理,一般)
- 視覚障がい者の情報取得を支援する,聴きとりやすい高速音声再生技術(福祉と音声処理、一般)
- 4. 高齢者のための音響処理技術(福祉用途の映像・音響・触覚技術)