手書きの原稿や作文などの紙媒体を、テキストデータにする作業を文字起こしと言いますが、場合によっては撮影された画像をテキスト化することもあるでしょう。以前であれば、画像の場合でもテキスト化するには一つ一つ、手打ちで文字を入力する必要がありましたが、今回ご紹介するGoogleの機能の一つである、「Googleドキュメント」を使用することで、簡単に画像からテキストデータにすることができます。
そこで今回は、Googleドキュメントを使って、画像から簡単にテキストをデータ化する方法をご紹介したいと思います。
OCRとは?
やり方を説明する前に、まずはOCRについて説明したいと思います。OCR(光学文字認識)とは、活字文章の画像を文字コードに変換するソフトウェアのことです。OCRは人工知能やマシンビジョンの研究分野として始まったと言われています。
今回ご紹介する、GoogleドキュメントにはこのOCRの技術が使われています。しかし、まだまだOCR技術は発展段階ですので、全ての画像からテキストデータを作成することはできません。しかし、一定の条件を満たした画像であればかなりの精度でテキストデータ化することができますので、ぜひ活用してみましょう。
鮮明な画像を用意する
テキスト化する画像はできるだけ鮮明なものを用意しましょう。残念ながら手書き文章では、画像が鮮明でもテキストデータ化することはできません。できるだけコントラストがはっきりとしていて、文字が見やすい画像がいいでしょう。フォトショップなどを使って、コントラストをはっきりさせるのもいいかもしれません。
Googleドライブにアクセス
テキストデータ化する画像を用意したら、Googleドライブに画像をアップしましょう。Googleにログインすると画面上にアプリケーションを選べるアイコンがありますので、その中からGoogleドライブを選択します。するとGoogleドライブファイルが開かれますので、その中にテキストデータ化する画像をドロップ&ドラッグで読み込ませます。
Googleドキュメントで開く
次に、Googleドライブに読み込ませた、テキストデータ化したい画像をGoogleドキュメントで開きます。画像をクリックするとアプリで開くという項目がありますので、クリックします。その中にあるGoogleドキュメントをさらにクリックします。こうすることでテキストデータ化したい画像を、Googleドキュメントで開くことができます。
画像がテキストデータとして開く
Googleドキュメントで開いた段階で、画像がテキストデータ化されていると思います。ある程度、鮮明な画像であればこの段階で十分かとは思いますが、場合によっては誤字や脱字があると思いますので、最終的には自分で確認して修正したほうがいいでしょう。
まとめ
今回はOCR技術の一つである、Googleドキュメントを使った画像データからの文字起こしについてご説明しました。まだまだ発展段階の技術ですので、完璧な精度とまではいきませんが、場合によっては十分に活用でき、文字入力が今まで以上に効率よく作業できることでしょう。しかし、手書き文字や、画像があまり鮮明でない場合は、精度が良くないと思われますので、状況をみて使用しましょう。
文字入力やデータ入力は、とても時間と労力を使用する作業になります。今回ご紹介したGoogleドキュメントを使用した方法などを活用することにより、作業をスピードアップ化することもできますが、テキスト化するデータがとても大量にあったり、タイピングが苦手な人が作業した場合、膨大な時間がかかってしまう可能性があります。
そんな時は、無理をせずに専門の代行業者を活用して、効率よく作業しましょう。