3分以内で覚える!テープ起こしの「素起こし」「ケバ取り」「整文」の違い

2021/04/21
テープ起こし作業を外注する際、覚えておきたいのが
  • 素起こし
  • ケバ取り
  • 整文
3つの違いです。 「ケバ」といった単語から想像できる方も多いでしょうが、明確に意味を理解しておくと「今回の作業は素起こしで頼みます」といったように業者とコミュニケーションが取りやすくなります。 今回はテープ起こしを依頼したことがない方向けに、3つの重要単語の意味合いの違いを解説していきます。

そのままテープ起こしをすればよいわけではない!目的によって使い分けるのが重要

テープ起こしとは、音声を記録できる媒体に入っている会話内容を文字に起こす作業です。テープとは付いていますが現在ではデジタルデータの音声を起こすケースが多いでしょう。 人間は会話を行う際、
  • 考える際沈黙する
  • 「あ~っ」といった意味のない言葉を出して会話を始める
  • 何度も同じことを説明する
といった特徴があります。 ですから文字に起こした際そのままだと意味が分かりにくい場面も多いです。 会話内容をそのまま起こすのは素起こしに該当します。 ただし
  • 文字起こし内容の理解しやすさを優先する場合はケバ取りを依頼する
  • 広報記事などで使う場合は整文化しておく
といったように、目的に応じて素起こし以外のテープ起こし手法が適している場合もあるので注意してください。

加工の度合いで変わってくる!?「素起こし」「ケバ取り」「整文」の違い

「素起こし」「ケバ取り」「整文」は音声データからの加工の度合いで分けることができます。

素起こし

音声データの加工レベルが最も少ない作業手法です。 録音した内容をなるべくそのまま、文脈や意味合いなどが変であっても書き出す手法になります。「えー」といった息継ぎ音も書き起こし対象になりますし、何度も同じ表現が使われている際も一言一句違わずに書き取るのがポイントです。 会話内容をそのまま文字に変換するとおかしい部分が増えるのは先ほど説明しましたが、必要な場面もあります。たとえば「AIの認識データとして会話データが必要」という場合は、意味がない言葉も含めて解析を行いAIの学習で認識させる必要性が出てきます。

ケバ取り

素起こしと比較すると加工度合いが大きいです。 特に意味がない言葉をケバと呼びます。録音内容でケバに該当するのは
  • 「えー」などの息継ぎ音
  • 「うん」といった相づち
  • 「要するに」など何度も出現する言葉
といった言葉です。ケバがあるまま文章化すると内容が読み取りにくくなる危険があります。 しかしケバ取りで無駄と思われる部分が除去されると、文章だけで何を説明しているのかがすぐに分かるようになるのがポイントです。「資料としてテープ起こしした会議データを保管したい」といった場合はケバ取りありでの作業依頼が適しています。

整文

ケバ取りよりさらに加工度合いが増します。 そのまま訳すと「整った文」となりますが、ここで言う整った文とは「書き言葉」を指しています。文章に適している書き言葉へと話し言葉で構成されている録音データを変換していくのがポイントです。
  • 必要な助詞を補完する
  • 余計なケバを削除する
  • 「いろんな」を「いろいろ」にするなど書き言葉にしていく
といった作業で読みやすい文章を作成していきます。 「Webサイト上でインタビューデータをアップロードしたい」といった場面で適している手法です。ただし変換の仕方によってはニュアンスが変わってしまう点に注意してください。

まとめ

今回は「素起こし」「ケバ取り」「整文」、3つのテープ起こしに関する言葉の違いをご紹介してきました。
  • 素起こしはそのまま会話内容を文字にする
  • ケバ取りは相槌などの意味がない部分を削除して文字にする
  • 整文は書き言葉として適するように会話内容を変換していく
です。 目的によって適した手法が変わって来るので、業者が対応しているかも含めて選定を行いましょう。