音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
文の区切りが明確でない,一文が長くなる,文の途中に間(ポーズ)が空くなどの現象が見られる自然な話し言葉を,適切な単位に区分化する処理が求められている.筆者らは,区分化の単位として従来用いられている文や節に代わる,プロの同時通訳者が原言語からターゲット言語に変換する自然なタイミングである音声翻訳単位を提案し,同単位の特徴と,言語情報ならびに韻律情報とSVMチャンカ用いた音声翻訳単位境界の推定手法について検討を行ってきた.一方,書き言葉では,区分化の単位として,句読点が広く用いられている.本稿では,音声翻訳単位境界と句読点との関連性と,プロの通訳者が付与した音声翻訳単位境界情報と句読点情報の双方を用いた場合の音声翻訳単位境界推定への効果について述べる.日本語話し言葉コーパス(CSJ)を用いた実験おいて,句読点既知データの場合F値0.88,句読点未知データの場合F値0.86と,プロの通訳者によるF値0.84に相当する性能を達成した.
- 2008-12-02
著者
-
河原 達也
京都大学学術情報メディアセンター
-
中村 哲
独立行政法人情報通信研究機構:(株)atr音声言語コミュニケーション研究所
-
中村 哲
Nict-atr
-
中村 哲
情報通信研究機構
-
清水 徹
独立行政法人情報通信研究機構知識創成コミュニケーション研究センター
-
河原 達也
独立行政法人情報通信研究機構知識創成コミュニケーション研究センター
-
中村 哲
情報通信研究機構:atr音声言語コミュニケーション研究所
-
清水 徹
独立行政法人情報通信研究機構知識創成コミュニケーション研究センター:atr音声言語コミュニケーション研究所:京都大学情報学研究科
-
中村 哲
独立行政法人情報通信研究機構|株式会社国際電気通信基礎技術研究所
-
中村 哲
独立行政法人 情報通信研究機構 知識創成コミュニケーションセンター:国際電気通信基礎技術研究所(atr)音声言語コミュニケーション研究所
-
中村 哲
独立行政法人 情報通信研究機構
-
清水 徹
独立行政法人 情報通信研究機構 知識創成コミュニケーション研究センター
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 会議録作成支援のための国会審議の音声認識システム (画像符号化・映像メディア処理レター特集)
- 京都観光案内対話コーパスにおける対話行為タグの設計と分析(理解)
- 同調的対話システム構築のための音声対話コーパスの構築(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識(音声,聴覚)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
- 会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 話し言葉における引用節・挿入節の自動認定および係り受け解析への応用
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 点予測と系列予測の2段階化による品詞推定の精度向上
- 点予測と系列予測の2段階化による品詞推定の精度向上
- ウエーブレットの最適化と雑音プロファイルを用いた雑音抑圧による頑健な音声認識
- SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- 「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
- Webからの情報抽出を用いた音声対話システム
- 国会音声認識システムの音響・言語モデルの半自動更新
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- 文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
- 点予測による形態素解析
- 文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応
- ベイズ推論を用いた連続音声からの言語モデル学習
- スライド情報を用いた言語モデル適応による講義音声認識
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- ウイグル語の形態素に基づく言語モデルと音声認識システム
- 頑健なパラメタ推定のためのAggregated EM法の提案と評価(特徴量・音響モデル,第9回音声言語シンポジウム)
- 頑健なパラメタ推定のためのAggregated EM法の提案と評価(特徴量・音響モデル,第9回音声言語シンポジウム)
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- 文化と言語の維持保存に貢献するためのデジタル博物館の試み : トランスクリプションデータを流用する字幕映像生成システムの提案
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
- 統計的言語モデル変換を用いた音響モデルの準教師つき学習
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 音声認識器の尤度を用いた残響抑圧パラメータの教師なし最適化(認識)
- 2ZN-1 ポスター会話中の音リアクションイベントに基づくホットスポットの抽出(情報爆発時代における対話インタラクション,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 4.対話を通じてユーザの意図・興味を探り情報検索・提示する情報コンシェルジェ(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- 音声対話システムにおける物体指示のための信念ネットワークを用いた曖昧性の解消
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- Web からの情報抽出を用いた音声対話システム
- Webからの情報抽出を用いた対話システムの評価
- 自動獲得した未知語の読み・文脈情報による仮名漢字変換
- 頑健なパラメタ推定のためのAggregated EM法の提案と評価(特徴量・音響モデル,第9回音声言語シンポジウム)
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習(音声,聴覚)
- 効率的なクロスバリデーションに基づく混合ガウス分布の最適化法とその拡張(音響モデル)
- 効率的なクロスバリデーション尤度評価に基づく混合ガウス分布の最適化(音響・音韻モデル)
- 述語項の類似度に基づく情報推薦を行う音声対話システム
- ウエーブレットに基づくウイナーフィルタを用いた雑音及び残響に頑健な音声認識
- 識別学習に基づく音声認識単語辞書の最適化
- 講演に対する読点の複数アノテーションに基づく自動挿入
- テキストと音声を用いた単語と読みの自動獲得
- Web時代の音声・言語技術
- 信頼度基準デコーディングを用いた高効率な単語グラフ生成法
- 連続音声認識ソフトウェアJulius(研究のツールボックス(2))
- 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム
- 音声会話コンテンツにおける聴衆の反応に基づく音響イベントとホットスポットの検出
- BICに基づく統計的話者モデル選択による教師なし話者インデキシング(音声,聴覚)
- BICに基づく話者モデル選択の教師なし話者インデキシングにおける評価(福祉と音声処理及び一般)(音声)
- BICに基づく話者モデル選択の教師なし話者インデキシングにおける評価(福祉と音声処理及び一般)
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 点予測による形態素解析
- 情報コンシェルジェ : Mind Probingに基づくマルチモーダルインタラクションシステム(「コミュニケーションと気づき」及び一般)
- 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
- ウエーブレットパケット分解による残響に頑健な音声認識
- 2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(第5回音声言語シンポジウム : システム・信頼度)
- 2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(第5回音声言語シンポジウム : システム・信頼度)
- 識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
- 識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応(音声,聴覚)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声認識技術を用いた講演・講義への字幕付与
- 講演に対する読点の複数アノテーションに基づく自動挿入
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応
- 4. 音声認識技術を用いた講演・講義への字幕付与(教育におけるICTと映像情報の活用)
- スマートポスターボード : ポスター会話のマルチモーダルなセンシングと認識(オーガナイズドセッション:マルチモーダル情報によるコミュニケーション環境理解,認識,理解,対話,一般)