- 素起こし
- ケバ取り
- 整文
目次
そのままテープ起こしをすればよいわけではない!目的によって使い分けるのが重要
テープ起こしとは、音声を記録できる媒体に入っている会話内容を文字に起こす作業です。テープとは付いていますが現在ではデジタルデータの音声を起こすケースが多いでしょう。 人間は会話を行う際、- 考える際沈黙する
- 「あ~っ」といった意味のない言葉を出して会話を始める
- 何度も同じことを説明する
- 文字起こし内容の理解しやすさを優先する場合はケバ取りを依頼する
- 広報記事などで使う場合は整文化しておく
加工の度合いで変わってくる!?「素起こし」「ケバ取り」「整文」の違い
「素起こし」「ケバ取り」「整文」は音声データからの加工の度合いで分けることができます。素起こし
音声データの加工レベルが最も少ない作業手法です。 録音した内容をなるべくそのまま、文脈や意味合いなどが変であっても書き出す手法になります。「えー」といった息継ぎ音も書き起こし対象になりますし、何度も同じ表現が使われている際も一言一句違わずに書き取るのがポイントです。 会話内容をそのまま文字に変換するとおかしい部分が増えるのは先ほど説明しましたが、必要な場面もあります。たとえば「AIの認識データとして会話データが必要」という場合は、意味がない言葉も含めて解析を行いAIの学習で認識させる必要性が出てきます。ケバ取り
素起こしと比較すると加工度合いが大きいです。 特に意味がない言葉をケバと呼びます。録音内容でケバに該当するのは- 「えー」などの息継ぎ音
- 「うん」といった相づち
- 「要するに」など何度も出現する言葉
整文
ケバ取りよりさらに加工度合いが増します。 そのまま訳すと「整った文」となりますが、ここで言う整った文とは「書き言葉」を指しています。文章に適している書き言葉へと話し言葉で構成されている録音データを変換していくのがポイントです。- 必要な助詞を補完する
- 余計なケバを削除する
- 「いろんな」を「いろいろ」にするなど書き言葉にしていく
まとめ
今回は「素起こし」「ケバ取り」「整文」、3つのテープ起こしに関する言葉の違いをご紹介してきました。- 素起こしはそのまま会話内容を文字にする
- ケバ取りは相槌などの意味がない部分を削除して文字にする
- 整文は書き言葉として適するように会話内容を変換していく