写真の文字や画面キャプチャをした画像に書かれた文字をテキスト化したい場合、いろんな手段がありますが、最も簡単で高性能な方法がようやく見つかりましたのでご紹介します。
今回ご紹介する方法はパソコンを使用します。スマホの場合はOCRアプリを利用する方法がありますが、精度の問題などから今回は見送りました。
それでは行ってみましょう!!
文字起こしは意外とハードルが高い
実際にやってみると分りますが、サクッと文字起こしをするのは意外と難しいです。PDFの画像をテキスト化したり、OCRソフトを利用したり、すでに色んな機能やソフトは存在するのですが、テキスト化率が悪かったり、思った場所がテキスト化の範囲にならなかったり。
そんな中、やはりGoogle先生はすごかった。と感服しました。
今回は、GoogleドライブとGoogleドキュメントを利用します。
まず、サンプルの画像から。以下の案内文章を文字起こし、テキスト化してみましょう!
Googleドライブにアップ → Googleドキュメントで開くだけ
手順はわずか2ステップ。Googleドライブにドラッグ&ドロップで対象となる画像ファイルをアップロードします。
アップロードした画像ファイルを右クリック、アプリで開く→Googleドキュメントを選択します。
Googleドキュメントが開き画像の下に、画像の文章が抽出されテキスト化されています!!そう、何も変換操作は必要がないのです。これが手間いらずで素晴らしい!!
写真の色や文字の大きさが反映されていますがテキストはこのようにきちんと変換されています。今回はフォントサイズや色を変更しましたが、テキストが必要なだけならこの装飾変更は必要ありません。
重要なのはOCR精度ですが、結果は以下の通り。
統合のご案内 謹啓 春分の候、益々ご健勝のこととお慶び申し上げます。
平素は格別のご厚誼に預かり厚く御礼申し上げます。 さて、このたび株式会社ホンダカーズ大阪は、営業体制のより一層の充実を図るため、 令和2年4月1日より株式会社ホンダカーズ大阪と株式会社ホンダ四輪販売南近畿が統合し、
新生 株式会社ホンダ四輪販売関西としてスタートする運びとなりました。 統合後は大阪府・奈良県・和歌山県に新車販売69拠点、中古車販売10拠点の
新ネットワークを形成することとなり、 これを機にスタッフ一同お客様になお一層心を込めて尽くす所存でございます。
これまで皆様方より賜りましたご厚誼に感謝申し上げますとともに、 従来にも増してご指導ご支援を賜りますようお願い申し上げます。
謹言 令和2年3月吉日
株式会社 ホンダカーズ大阪 代表取締役社長 柳川 明弘
・・・完璧です。
明朝体で文字の大きさも最適、文章もビジネス文章ということもありますが、かなりの精度と言えるでしょう。
今回のサンプル画像は横書きでしたが、縦書きだったり、画面キャプチャでも問題なくテキスト化されます。
さいごに
今回は、GoogleドライブとGoogleドキュメントを使ったテキスト化の方法をご紹介しましたがいかがでしたか?Googleドキュメント内で写真からテキスト化する方法があればさらに便利ですが、現状はなく、Googleドライブから対象画像を右クリックしてGoogleドキュメントを開く方法しかないようです。
とっても便利なのでぜひ試してみてくださいね!