How to Tackle a transcript ja

From TED Translators Wiki
Jump to: navigation, search
Read this article in other languages: EnglishEspañol

(本ガイドは2017/12/15に刷新されたHow to Tackle a Transcript の更新版の翻訳を日本語にローカライズしたものです)

TEDx の文字起こしとは、スピーカーの話している言語を字幕化することです。字幕には、スピーカーの語ったことを文字にするだけではなく、字幕のコマに適切に分け、発声に合わせて表示されるようにする必要があります。クローズド・キャプション同様、聴覚障害者や難聴者のために音情報も含めて作成します。以下には、TED Translators のボランティアとしてTEDx の文字起こしに役立つヒントや戦略を示します。まだボランティア登録をしていない方は、TED.com/transcribeをご覧ください。

このガイドは、このビデオチュートリアルを補完するものです。字幕の文字数制限や読みやすい文字数などは、本ガイドの原文に記載されているラテン系言語のものと、日本語に合わせたものを併記してあります。ルールの中で、日本語として適切でないと確信のある部分については、このメールアドレスtranslate@ted.comか日本語のランゲージコーディネーター(LCあっとted-ja.com)まで、ご連絡ください。

重要: 文字起こしを開始する前に、こちらのガイドを参照し、Amara上のビデオが TED チームのものか確認してください。(TEDx オーガナイザーの方で、文字起こしを希望されるトークのビデオが、TED チームのものとしてAmaraで見つからないとい場合は、上記ガイドにビデオを追加依頼するフォームが載っています)。TED チームのものとして登録されていないビデオは、作業してもYouTube へ字幕を反映したり、作成した字幕の翻訳をしたりといった作業ができません。こちらのチュートリアルで、Amara で作業可能なタスクを探す方法をご覧ください。

トークが文字起こしされることのメリット

  • 字幕があると、聴覚障害者や難聴者も見ることができます
  • 字幕のあるトークは検索エンジンに記録され、トークそのものやTEDx イベントへのアクセスが増えます
  • トークは字幕がないと翻訳できません
  • TED.com に掲載されるトークの候補として検討される可能性もあります

文字起こしの流れ

TEDx トークの動画は、YouTube にアップロードされます。 動画の字幕は、TED Translators のパートナーでありオンラインツールのAmara を使って作ります。 こちらのOTP ラーニングシリーズに使用方法が簡単にまとめてあります。 Amara アカウントの作り方や字幕を作成するビデオの探し方の参考にしてください。

文字起こしが完了した後、字幕は他のボランティアによるレビューを経て、ランゲージコーディネーターによって承認される必要があります。承認された字幕はYouTube のビデオページで選択できるようになります。文字起こしとレビュー担当者は、それぞれTED.com のプロフィール上に作業したビデオがクレジットされます。

他にも情報収集したり質問をしたりできるよう、I Translate TED Talks(文字起こしの話題も扱います。)や、日本語翻訳者のFacebookグループ Japanese TED Translatorsに参加しましょう。それでも解決しない場合、translate@ted.comからTEDに問い合わせることもできます。

ヒント: 英語字幕を作成する場合には、English Style Guide を、日本語から英語に翻訳する場合は日英翻訳ガイドを必ず読んでから始めてください。

文字起こし手順の大まかな流れ

Image shows the controls box in the Amara interface.
ユーザーは画面の使い方やガイドラインを文字起こしの画面からも見ることができます

18分のトークを文字起こしするには、だいたい4~6時間ほどかかります。ユーザーは、このタスクを30日以内で終了しなければなりません。文字起こしは次の3つの工程で行います。

1. テキストを入力し、字幕のコマに分ける
この工程には、だいたい2~4時間ほどかかります。スピーカーが発声したことを文字に入力し字幕に分けます。字幕については、TED の標準に従って、字幕の文字数や読みやすさを調整します。たとえば、言い間違いを削除し、2つの文を1つの字幕に入れないといった基準があります。

2. 字幕表示タイミングを調整し、読みやすい速度にする
この工程には、だいたい1時間程度かかります。文字起こし担当は、分かりやすい画面を使って、最初の工程で作った字幕がいつ表示されるのかを指定して、次に必要に応じてさらにタイミングを合わせてTED の基準に合う読みやすさとなるように調整します。

TED字幕ルール早見表
字幕1枚の表示時間 1~7秒
1秒あたりの字数の上限 10 文字/秒
字幕1枚の行数の上限 2行
1行の字数の上限 21 文字
字幕開始タイミング 発声から100ミリ秒以上先行しない
改行位置 意味的なまとまりを切らない
字幕1枚の行のバランス なるべく均等に
字幕の構成 ある文の末尾と次の文頭を1つの字幕にしない

(一方が完結している短文なら良い)

文の分け方 字数制限を超えない限り、1文を細かく分けすぎない
音の表記 (丸括弧で囲む)音情報は3秒を越えないようにしてください。
画面上の文字の文字起こし [角括弧で囲む]
句読点 読点の代わりに半角スペース、

句点の代わりに全角スペースを使う

3. Title とDescription を入力する
文字起こしした字幕を次のレビュアーが作業できるように提出するまえに、文字起こし担当はTitle とDescription がここに説明されているように、TED の基準と合っていて、トークが話されている言語と同じになっているか確認する必要があります。

字幕の文字数と読みやすさの作業についての概略は、これらのチュートリアル()を見てください。文字起こしに参考になるやり方が説明されています。次に、ここにあげた3つの手順をさらに詳しく説明し、字幕の分け方やタイミングの調整についてさらに技術的な内容を説明します。

覚えておくと作業がしやすくなる項目を一覧にまとめました。詳細なガイドラインについては、このビデオチュートリアルを見てください.

テキストを入力し、字幕のコマに分ける

この工程は、だいたい2~4時間かかります。ユーザーはトークを再生し、スピーカーが話していることを入力していきます。字幕が読みやすくなるように、英語の文字起こしでは字幕が1行42文字を超えたら改行して2行目に入れ、1字幕コマが84文字を超えたら、新しい字幕コマにします。日本語の場合は、1行21文字程度、1字幕コマ42文字程度を目安に考えてください。作業しやすくするために、各字幕に対してこの文字数が、文字起こしの画面に表示されています。

主な目的は読みやすく、文字がまとめられた字幕を作ることです。このために、まずは文節や文法上繋がっている文言がまとまるようにする必要があります。TED の基準に合うように文字数や改行を行うために、文の意味を変えないように言い換えて短くする必要があることがあります。また、言い間違いや明らかな間違いは字幕に残してはいけません。

Image shows the transcribing step in the Amara interface.
最初の工程では、テキストを入力し、字幕のコマに分けます

文字を字幕に割り当てる際に、次の観点から検討する必要があります。

1. 字幕は2行にするのに十分な文字数があるか?
日本語で21文字を超える字幕は、Shift+Enterを押して1コマ内で2行に分けます。21文字以内の字幕は2行に分ける必要はありません。非常に短い行が2行あると見づらいためです。重要事項:字幕の文字数が42文字を超えないようにし、3行以上にしないようにしてください。

2. 字幕が1コマにしては文字数が多すぎないか?
42文字を超える字幕は、別のコマに分けて入れる必要があります。

3. 各行または各字幕コマがきちんと文節の終わりで切れているか?
文節や文法上繋がっている文言が途中で切れないようにしなければなりません。たとえば、所有格と名詞のつながりや、姓名を途中で分断してはいけません。詳しくはこちらを見てください。

4. 冗長な文言を残していないか?
途中で言いなおした表現(「言いたいのは―いえ、私が今日お話しするのは」)や繰り返された表現(「ありがとう、ありがとう、ありがとう、ありがとう」)や発言に詰まった表現(「え~と」「え~」など)は字幕に含んではいけません。また、明らかに間違っている箇所は、正しい表現を使います。例えば、スピーカーが、「We think」ではなく「We thinks」と誤って発言している場合です。また、極々稀に、スピーカーが誤って発言したことが確実でも文字を変えることで意味が変わってしまう場合には、[]で囲って、意図的に変更していることを明示してください。例えば、「昇る」と「落ちる」のような間違いで、次のようにします「私が午前9時に目覚めると、既に日が[昇って]いました」。

5. 本当に字幕をそこまで分割する必要があるか?
文字数の制限や読みやすさを保ちつつ、可能な限り1つの文節がまるまる含まれるようにしてください。これにより、字幕が読みやすくなり、またのちに翻訳者が翻訳する際にも、小さな塊ではなく大きな塊で訳せます。スピーカーが話した言語と同じように、翻訳先の言語でも小さな塊で訳せるとは限りません。詳しくは、このガイドを見てください。翻訳のしやすい字幕を作るやり方が説明されています。
重要事項: 先行する文と後続の文を、同じ字幕には絶対に入れないでください。例えば「これがその理由です(改行)別のアイデアは」、などのようにしないでください。

6. トークを理解するのに必要な全ての音情報を入れているか?
トークを理解するのに必要な全ての音情報を入れてください。たとえば、言葉になっていないような「(せき払い)失礼しました」を表すようにしたり、画面に映っていない人が話している時にだれが話しているのか分かるようにしたりします。また、音楽が流れたり、笑いや歓声が観客から沸き起こったりしているのが明らかな場合も、トークの開始前の音情報(音楽、拍手)以外はすべて字幕にします。また、一時的に異なる言語で発声されている箇所は、トークの言語の字幕に翻訳した文言を入れて、「(アラビア語)これが私のアイデアです」のように表します。音情報は()で囲って「(音楽)」のように表します。音そのものを表現し、音を発生させた動作などを記載しないようにします。例えば、「(銃声)」とし「(犬が銃を撃つ)」とはしません。音情報についての詳しい説明は、このガイド.を見てください。

7. 画面に表示されている文字を含めたか?
もし発声している音声を文字にしている部分と被ることなく、字幕の文字数と読みやすさの基準が守れるようなら、トークの一部で画面に表示されている文字を入れてください。たとえば、スライド中の文字やステージで再生されたビデオに含まれている字幕などです。この文字を含むことで、これらの文字も翻訳で訳すことができるようになります。スピーカーが話したことではなく、画面上の文字だということを表現するために、[]で囲って文字を表すようにします。

画面上の文字でも、トークの内容に関連のないものや、翻訳されない文字は字幕に入れないでください。たとえば、TEDx イベントの名称です。

字幕表示タイミングを調整し、読みやすい速度にする

この工程は、だいたい1時間程度かかります。前工程までできれいにまとめられた字幕を使って、文字起こし担当がビデオを流しながらどのタイミングで字幕を表示させるかシステム上で決めていきます。ユーザーはトークを再生しながら、最初の字幕を表示開始すべき時に合わせて上矢印を押し、字幕の表示を終了して次の字幕を表示すべき時に合わせて下矢印を押します。それが終わると、ユーザーは、ビデオの時間に合わせたタイムラインのスライダーを使って、字幕の開始タイミング、終了タイミングを微調整します。たとえば、スピーカーが話した言葉の後から字幕が表示開始されるような場合を修正します。

字幕のタイミングが調整されたら、ユーザーはタイムラインのスライダーを使って、読みやすい文字数にする調整を行います。画面に表示されている字幕を読みやすくするには、ラテン系言語の場合は1つの字幕内の文字数が1秒当たり21文字を超えないようにしなければなりません。日本語の場合には、10文字を超えないようにする基準があります。この1秒当たりの文字数は、Amara で表示される字幕コマ毎に表示されています。この基準を超えた箇所については、文字起こし担当が意味に変更が生じないように文字を短くすることや、字幕の表示時間を延長することで訂正することが可能です。

ヒント::赤色のエクスクラメーションマークが文字数や読みやすさの基準を超えている字幕に対して表示されます。ただし、ラテン系言語の基準に照らし合わせて表示されますので、日本語の場合には、別途注意するようにしてください。


タイミングを合わせる際には、次の観点から検討する必要があります。

Image shows the synchronization step in the Amara interface.
字幕のタイミングはゲームのような画面を使って調整します

1. 1秒当たり21文字を超えないように調整してあるか?
読みやすさの観点から1秒当たりの文字数は、最大21文字/秒です。日本語では10文字/秒。読みやすさを保つためなら、たとえ後続の字幕の言葉が話されている時間に被ってしまっても、字幕の表示時間を長くしても構いません。ただし、100ミリ秒を超えて早く表示しないようにしてください。 表示時間を長くすることで多くの場合は十分かもしれませんが、必要な場合には読みやすさを保つために、意味を替えないように短くすることや圧縮することも合わせて実施してください。もし文字数が多すぎる場合には、字幕は読む時間がないまま消えてしまいます。したがって、見る人が追いついていけない一字一句間違いのない字幕を作るよりも、短くするほうが良いのです。文字起こしされた字幕は翻訳の元にもなり、翻訳されるとさらに文字数が増えることがありますので、読みやすい文字数/秒は重要です。 字幕を短くする方法や圧縮する方法については、こちらのガイドをご覧ください。


ヒント: もし、字幕が科学技術用語や分かりにくい固有名詞などの難解な語彙を含んでいる場合には、21文字/秒の基準よりもより少ない文字数にすることを検討してください。これにより、見ている人に字幕の内容を理解しやすくして、後に文字数が多くなりがちな翻訳先の字幕でも読みやすい文字数にしやすくなります。

2. 字幕は該当する発声されている言葉と同期されているか?
通常の場合には、字幕はスピーカーが発声し始めた時に表示されるべきです。しかしながら、より読みやすくすることは、完全に同期した字幕を作るよりも重要です。もし、先行する字幕の表示時間を長くすることで読みやすさを保つためなら、後続の字幕をスピーカーが実際に話し始めた後に表示しても構いません。ただし、スピーカーが発声するよりも前に字幕を表示開始しないようにしてください。身振りや画面上の文字と一致していない場合には、見にくくなってしまいます。ビデオと字幕の流れが一致している絶対的な必要性がある場合には特に遵守してください。例えば、スライドで何かが明らかになる画面が表示される前に、その内容を明かすような字幕を出すようなことは可能な限り避けるべきです。

3. 字幕の表示時間が1秒未満または7秒以上となっていないか?
字幕が1秒未満しか表示されないと、ほとんどの人が読む間もなく表示が終了してしまいます。また、翻訳されると問題が複製されてしまいます。字幕が7秒以上表示されると、見るのに邪魔になるため、2つの字幕に分けてください。

4. 音情報は3秒を超えないようにしてください
音楽や拍手が長く続く場合には、例えば(音楽)と最初の3秒間を表示した後に、終了間際に(音楽終わり)と表示します。

5. 字幕が発声の無いところまで過剰に継続していないか?
発声が終了してから1秒が経過しているのに、字幕が表示されたままにならないようにしてください。もし、タイミング調整の際にこの無音状態が残ってしまった場合には、全体のタイミング調整が終了してから、該当箇所のタイムラインのスライダーを調整して無音状態の箇所に字幕が表示されないように調整することができます。

避けるべき引用符記号、アポストロフィー記号、ダッシュ記号

日本語の場合は、別途日本語字幕の表記ガイドラインにあるように二重引用符には開始終了のある“”を使用し、ダッシュには―を使用してください。日本語以外の場合には、本項目に指定されているアスキー文字を使用してください。 「“”」などの多様な引用符を使用しても、再生プレーヤーによっては正しく表示されないことがあります。二重引用符には、アスキーで指定されているストレートクォーテーションマーク「"」を使い、引用符にはストレートアポストロフィー「''」を使用してください。アポストロフィーを使うときも、曲線型の「’」ではなく、ストレートアポストロフィー「'」を使用してください。同じく、エムダッシュにも「–」や「—」ではなく、ハイフン「-」を使用してください。

各言語に固有の句読点に関しても、アスキーに該当するものを使用することを推奨しています。日本語に関しては、「、」「。」は主に半角、全角スペースにて代用しています。アスキーを使用することは慣用的なルールに反するかもしれませんが、字幕フォーマットの技術的な制約から、正しく字幕が表示されないことになるユーザーがいるかもしれません。この制約は字幕にのみ適用し、Title とDescription では、慣用に従った句読点を使用してください。

HTML タグや他の書式の指定はTEDx の字幕では使用してはいけません。YouTube 再生プレーヤーでは表示されないためです。

Title とDescription の表記方法

Image shows how to edit the title and description of the talk in the Amara interface.
「鉛筆」のボタンを押してTitle とDescription を編集します

TEDx トークには、TEDx オーガナイザーが決めたTitle とDescription があります。YouTube に入力された内容がAmara に転送されています。ただし、時に情報が過剰だったり過少だったりすることや、下記の基準に沿っていないものがあります。基準に沿っていない場合には、文字起こしの時にAmara 上で正しいものにしなければなりません。 注記: トークの言語でTitle とDescription は書かれる必要があります。英語のトークでない場合には、英語のTitle とDescription を入れてはいけません。

Title の表記方法

日本語の場合には、次の表記を用いています。タイトル△|△講演者名△|△TEDxイベント名 (以前の表記から変更になりました。)。英語の場合でも同様で、次のように表記します。

On being a young entrepreneur | Christophe Van Doninck | TEDxFlanders

もし、この表記でない場合には、この基準に合致するように、変更してください。イベントの開催年を含んではいけません。 もし、Title が入っていない場合には、スピーカー名のみとしても構いませんが、イベントのオーガナイザーかスピーカーにタイトルを確認するか、自分自身でタイトルを考えることを検討してください。 英語のTitle の場合には、通常の文と同様に大文字を用いてください。Title の最初の文字や固有名詞の最初の文字のみ大文字にします。

Description の表記方法

Description 基本的に「です・ます調」で揃えています。 日本のTEDxのトランスクリプトを作る時はDescriptionの長さは2・3文。講演者の経歴は1文程度であれば含めても構いません。講演者氏名には敬称を付けません。トークの内容を簡単に紹介します。

Amara で、ビデオの左どなり上側の鉛筆マークをクリックすると、タイトルと Descriptionを入力するウィンドウが出てきますので、 ここから入力してください。 (Description は、今のところ YouTube には反映されませんが、さきざき TEDx のウェブサイトを公開したときに反映される予定、と聞いています) TEDx の説明の”TEDx is a program of local, self-organized events…”という定型のTEDx についての紹介は省略します。ただし、次の文言はDisclaimer として含まれている必要があります。オリジナル言語に含まれている場合はDescription に残し、含まれていない場合には追加して、翻訳の対象にもします。オリジナル言語が日本語の場合には日本語のDisclaimer をDescription に追加します。

(英語版)This talk was given at a TEDx event using the TED conference format but independently organized by a local community. Learn more at http://ted.com/tedx

(日本語版)このビデオは、TEDカンファレンスの形式で地元コミュニティが独自に運営するTEDxイベントにおいて収録されたものです。詳しくは http://ted.com/tedx をご覧ください。

2015年12月以前は、以下のものが使われていました。 (英語版)This talk was given at a local TEDx event, produced independently of the TED Conferences.

(日本語語版)このビデオはTEDカンファレンスとは独立して運営されるTEDxイベントにおいて収録されたものです。

日本語を含むそれぞれの言語での、本Disclaimer の文言はこのファイルを見てください。ここに存在しない場合には、それぞれの言語のランゲージコーディネーターに相談した上で文言を決定し、translate@ted.com に連絡してください。

より多くのトークを文字起こししてもらうには

あなたがTEDx オーガナイザーで、開催したイベントの文字起こしが残っているとしたら、OTP のコミュニティーにFacebook で呼びかけることを検討してみましょう。より優先順位の高いトークを1つか2つ選んで、なぜそのトークが文字起こしされることが重要か説明してください。トークを文字起こしすることを挑戦し甲斐のあることにし、文字起こししてくれた人たちに感謝する方法を考えてみてください。たとえば、イベントのウェブサイトから感謝する、というようなことです。

OTP の文字起こしや翻訳はボランティアで行われていて、世界中の何万ものTEDx トークの中から、何か価値を見いだしたトークを選んで作業しているということを忘れないでください。あなたのチームと地域のコミュニティはすでに参加したイベントのトークのアイデアを広める努力をしてきているのですから、地域のOTP コミュニティと協力してチームの人たちと「文字起こソン(transcribeathons)」を開催することにも挑戦してみてください。

TED Translators Wiki 内の他の日本語ページ

翻訳・字幕総合ガイドライン
翻訳・レビュー情報
TEDxと文字起こし情報
外部ツール情報
新規登録者向け情報