Sequential Linefeed Insertion into Lecture Transcription for Real-time Captioning
スポンサーリンク
概要
- 論文の詳細を見る
To generate readable captions for Japanese spoken monologue such as lectures in real time, it is necessary to sequentially display the caption into which proper linefeeds are inserted. This paper proposes a technique for sequentially inserting proper linefeeds into the lecture transcript whenever a bunsetsu, which is a linguistic unit shorter than a sentence in Japanese that roughly corresponds to a basic phrase in English, is identified. Assuming that linefeeds are inserted into bunsetsu boundaries, the technique can make the delay time of captioning shortest. The technique statistically judges whether or not a linefeed should be inserted into each bunsetsu boundary by using the information which is available at the time. We conducted experiments on linefeed insertion using a Japanese lecture corpus. From the experimental results, we confirmed that our method, which is bunsetsu-based linefeed insertion method, had almost as much accuracy as the sentence-based linefeed insertion method. In addition, we conducted the comparative evaluations with four baseline methods. As the results, we confirmed that our method could insert linefeeds more properly than the simple methods which are thought to have as same delay time as our method.
著者
関連論文
- 自然な読み上げ音声出力のための書き言葉から話し言葉へのテキスト変換(学生セッション I)
- 自然な読み上げ音声出力のための書き言葉から話し言葉へのテキスト変換(学生セッション I)
- 依存構造に基づく用例文検索手法とその評価(自然言語処理)
- 読みやすい字幕生成のための講演テキストへの改行挿入(自然言語処理)
- 講演テキストにおける読みやすさを考慮した改行位置同定(機械学習・応用)
- WWW上の学術情報文書からのメタデータ抽出(デジタルアーカイブの応用,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- 言語資源の用途情報の抽出と利用(情報抽出・評判分析)
- 3D-1 言語資源メタデータデータベースSHACHIの構築と利用(自然言語処理,一般セッション,人工知能と認知科学)
- D-5-4 表層パターンに基づく法律文の構文解析
- 対話同時通訳コーパスの構築とその特徴分析
- 英日同時翻訳のための依存構造に基づく訳文生成手法(自然言語処理)
- 4S-2 同時通訳者の話速変動の定量的分析(対話・質問応答,学生セッション,人工知能と認知科学)
- EscortJacs:外国人による日本語文作成を支援する用例文検索システム(コミュニティにおける教育・学習支援システム/一般)
- 自動通訳に向けた用語自動収集(翻訳,対話)
- 節の始境界検出に基づく独話文の係り受け解析
- 読みやすい字幕生成のための講演文への漸進的改行挿入
- 読みやすい字幕生成のための講演文への漸進的改行挿入
- 読点の用法的分類に基づく自動読点挿入
- 読点の用法的分類に基づく自動読点挿入
- あいづちコーパスの設計と評価
- 自然言語の漸進的解釈とその応用に関する研究 (人工知能分野における博士論文)
- 2S-1 英語論文に頻出する表現の獲得と分類(自然言語処理一般,学生セッション,人工知能と認知科学)
- 対話コーパスに基づく階層化された発話意図の推定
- 大規模音声対話コーパスを用いた対話理解
- 対話構造木コーパスを用いた発話意図予測(Session-3 対話・コミュニケーション, 第7回音声言語シンポジウム)
- 対話構造木コーパスを用いた発話意図予測(Session-3 対話・コミュニケーション, 第7回音声言語シンポジウム)
- 対話構造木コーパスを用いた発話意図予測(Session-3 対話・コミュニケーション, 第7回音声言語シンポジウム)
- 音声対話コーパスにおける発話意図タグの設計と評価
- D-5-6 話し言葉解析に基づく対話データからの情報抽出(D-5. 言語理解とコミュニケーション, 情報・システム1)
- リアルタイム字幕生成のための音声ドキュメントへの改行挿入
- 消費者の意見に基づく商品検索
- 構文構造を利用した英語論文からの表現の自動獲得
- 節の始端検出に基づく独話文の係り受け解析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 節の始端検出に基づく独話文の係り受け解析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 節の始端検出に基づく独話文の係り受け解析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 節境界に基づく独話の漸進的係り受け解析(自然言語処理)
- 同時的な独話音声要約に基づくリアルタイム字幕生成(要約・分割)
- 節境界単位での漸進的な独話係り受け解析
- 節境界に基づく独話文係り受け解析の効率化(仮名漢字変換・形態素構文解析)
- 読点の用法的分類に基づく自動読点挿入
- 英日話し言葉翻訳のための漸新的文生成手法
- 音声対訳コーパスからの日本語待遇表現生成規則の自動獲得
- E-018 講演の同時翻訳のための対訳データの作成と分析(自然言語・音声・音楽,一般論文)
- 読みやすい字幕生成のための講演文への漸進的改行挿入
- 同時的な日英対話翻訳のための日本語発話文の分割(第8回音声言語シンポジウム)
- 同時的な日英対話翻訳のための日本語発話文の分割(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 同時的な日英対話翻訳のための日本語発話文の分割(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 有限状態トランスデューサを用いた話し言葉の同時翻訳(福祉と言語処理/一般)
- 有限状態トランスデューサを用いた話し言葉の同時翻訳(福祉と言語処理/一般)
- CIAIR同時通訳データベースの構築と利用(セッション1)(人間による言語理解・言語処理)
- モノの用途表現を手がかりとしたWebからのノウハウの獲得
- モノの用途表現を手がかりとしたWebからのノウハウの獲得
- 5U-8 新聞記事内容と株価変動の関連性の定量的分析(情報抽出,学生セッション,人工知能と認知科学)
- D-5-6 同時通訳コーパスにおける単語発声時間の自動推定(D-5.言語理解とコミュニケーション,一般講演)
- WWW上の学術情報文書からのメタデータ抽出(デジタルアーカイブの応用,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- PARSEVAL measuresに基づく漸進的構文解析の定量的評価(研究速報)
- 依存構造に基づくコーパス検索(研究速報)
- 確率木接合方法に基づく漸進的構文解析(解析)
- 英日話し言葉翻訳のための漸新的文生成手法
- 拡張性を備えたオープンな電話対話システム開発ツールTEDDI
- 拡張性を備えたオープンな電話対話システム開発ツールTEDDI
- 拡張性を備えたオープンな電話対話システム開発ツールTEDDI
- F-8 拡張性を備えた対話システム開発支援ツールの構築(音声・音声言語情報処理,F.音声・音楽)
- 構文木からの再帰構造の除去による文圧縮(情報分析・要約(テーマセッション1))
- 構文木からの再帰構造の除去による文圧縮(情報分析・要約(テーマセッション1))
- 主辞情報付き文脈自由文法に基づく漸進的な依存構造解析(自然言語処理)
- 確率文脈自由文法に基づく漸進的構文解析
- 音声対話コーパスの収集と利用 : より豊かな車内音声対話システムを目指して(音声言語インタフェースの実用化と音声言語対話への展開)
- 主辞情報付き文脈自由文法に基づく漸進的な依存構造解析アルゴリズム
- 2000-NL-137-12 / 2000-SLP-31-7 マルチドメイン音声対話システムの構築手法
- 2000-NL-137-12 / 2000-SLP-31-7 マルチドメイン音声対話システムの構築手法
- 漸進的構文解析における構文的曖昧性とその解消
- 走行車室内音声対話収録システムの開発
- SD-2-1 実走行環境下における車内音声データベース
- 実走行車内における音声データベース(音声処理技術のデモの紹介)
- 実走行車内における音声データベースの構築
- 意見文からの評判情報抽出に基づく自然言語検索(意見・評判情報処理)
- 英文作成支援ツールとしての用例文検索システムESCORT
- D-5-5 対訳コーパス自動対応づけ手法の定量的評価法
- 2N-4 確率文脈自由文法を用いた漸進的構文解析における出力タイミング決定手法
- 漸進的な構文解析における出力タイミング決定の一手法
- 文法的不適格文に対する漸進的構文解析手法
- 安定性を備えた相づちコーパスの設計と評価(研究速報)
- CIAIR実走行車内音声データベース(ポスターセッション)(第5回音声言語シンポジウム)
- CIAIR実走行車内音声データベース(第5回音声言語シンポジウム : ポスターセッション)
- CIAIR実走行車内音声データベース(第5回音声言語シンポジウム : ポスターセッション)
- C11 学術論文からの英語表現集の自動生成(セッションC1情報と教育研究,一般発表概要,第7回情報プロフェッショナルシンポジウム)
- アンカーテキストを用いたWebディレクトリの構築(情報抽出・可視化)
- アンカーテキストを用いたWebディレクトリの構築(情報抽出・可視化)
- E-056 クエリの主観性に頑健な商品検索システム(E分野:自然言語・音声・音楽)
- 2ZA-1 漸進的処理に基づく音声対話メールツールSync/Mailの評価(マルチモーダル,一般講演,インタフェース)
- 3N-2 文脈自由文法の変換に基づく漸進的な話し言葉翻訳手法
- 車内音声対話システムのための事例に基づく発話意図推定
- 車内音声対話システムのための事例に基づく発話意図推定
- 話し言葉における文法的不適格文に対する漸進的翻訳手法
- Sync/Mail : 話し言葉の漸進的変換に基づく即時応答インタフェース
- Sync/Mail : 話し言葉の漸進的変換に基づく即時応答インタフェース
- 読点の用法的分類に基づく日本語テキストへの自動読点挿入(自然言語処理)
- Sequential Linefeed Insertion into Lecture Transcription for Real-time Captioning
- 講演のリアルタイム字幕生成のための逐次的な改行挿入