手書きの文書をテキストに変換する方法

もしデジタル化して編集、共有、保管を簡単にする必要のある手書きの文書が山積みになっているなら、手書きからテキスト(HTR)技術があなたを救います。この技術を使えば、スキャナーとソフトウェアさえあれば、手書きの文書を数ステップでテキストに変換できます。
目次
- 手書き文書のスキャンの課題
- Transkribusを使って手書き文書をテキストに変換する
- Transkribusの代替案
手書き文書のスキャンの課題
手書きの文書をスキャンしてデジタルテキストに変換することは、本当に手間がかかります。なぜなら、ユニークな課題が伴うからです:
- 手書きは人それぞれ異なり、従来の光学文字認識(OCR)ソフトウェアがテキストを正確に認識・転写するのが難しいです。
- 手書きの文書には、取り消し線のある単語や誤字などのエラーが含まれていることが多く、スキャンソフトウェアをさらに混乱させます。
- 手書きの文書の多くは古いものであり、紙の質、インク、そして余分なマークや折り目の存在がスキャンプロセスをさらに複雑にします。
これらの課題に対処するために、開発者たちは手書き文書をテキストに変換するために特化した手書きからテキスト(HTR)ソフトウェアを作成しました。
HTRツールは、高度なアルゴリズムを使用して、異なる手書きスタイルに適応し、意図的なテキストと余分なマークまたは修正を区別し、古いまたは損傷した文書に対処します。
Transkribusを使って手書き文書をテキストに変換する
手書きの文書をテキストに変換するツールは多くありますが、私が最も推薦するのはTranskribusです。これはデスクトップ版もあるオンラインソフトウェアで、非常に使いやすく、パフォーマンスを改善するためにトレーニングができます。
最初から、Transkribusの結果は期待外れかもしれません。しかし、このツールの本当の力はそのトレーニングインターフェースにあります。少しの時間と努力で、Transkribusをより正確に手書きを認識できるようにトレーニングでき、トランスクリプションの質を大幅に向上させることができます。
Transkribusの無料版では、最大100ページの文書を変換でき、月に最大5回のトレーニングを行うことができます(詳細はすぐにお知らせします)。始めるには、ツールのウェブサイトにアクセスし、無料トライアルボタンをクリックしてユーザーアカウントを作成します。

文書の変換を開始するには、Transkribusのデフォルトコレクションを開きます。コレクションは、作業を整理するためのフォルダのようなもので、各コレクションには個々の文書が含まれます。各文書は、実際のテキストページを表す画像で構成されています。

文書を追加するには、ファイルをアップロードボタンをクリックします。TranskribusはJPEG、PNG、PDFなど様々な形式を受け付けますが、最適な認識のためには300 DPIのJPEGを使用することを推奨しています。文書がアップロードされたら、手書きの文書をテキストに変換する準備が整います。

文書を開いて、変換したい画像をすべて選択します。認識ボタンをクリックします。

Transkribusは、さまざまな言語や時代に対応した公共モデルを提供しています。トレーニングなしで即座にテキスト認識を行うためには、文書の特徴に最も適したモデルを選択し、認識を開始ボタンをクリックして待ちます。私は英語イーグルモデルを選びました。

無料ユーザーによって作成された手書きテキスト認識ジョブは優先度が低いため、Transkribusが処理を完了するまで時間がかかる場合があります。

認識プロセスの後、Transkribusのドキュメントエディタを使用して結果を微調整します。これにより、テキストと画像ビューが同期され、直感的な編集プロセスが可能になります。エンティティ、イベント、または不確実なトランスクリプションにタグを使用することができます。
HTRパフォーマンスを向上させるためにカスタムモデルをトレーニングする
カスタムモデルをトレーニングするには、グラウンドトゥルースデータを準備します。これは、モデルが認識することを望む書き方スタイルに一致する手書き文書のセットを正確に転写することを含みます。あなたのデータが多様で代表的であればあるほど、モデルのパフォーマンスが向上します。

モデルをトレーニングするには、新しいモデルをトレーニングボタンをクリックします。テキスト認識モデルオプションを選択し、グラウンドトゥルース文書を含むコレクションを選び、トレーニングおよび検証データに含めるページを選択します。トレーニングデータはモデルのパラメータをフィットさせるために使用され、検証データはモデルのパフォーマンスを公正に評価します。

モデルの設定(言語や文字セットなど)を構成してトレーニングプロセスを開始します。これには、モデルがデータから学ぶ複数のサイクルや「エポック」が含まれます。Transkribusは、モデルのパフォーマンスが向上しなくなると、自動的にトレーニングを停止します。
トレーニング後に、カスタムモデルを使用して新しい文書をより高い精度でトランスcribeできます。
Transkribusの代替案
Transkribusは手書き文書をテキストに変換するための私の第一選択ですが、他にも優れたオプションがたくさんあります:
- Pen2Txtは、HTR分野の新参者です。多様な手書きスタイルに適応するために最新のAI技術を活用し、高精度を提供することを目指しています。現在開発中ですが、Pen2Txtはユーザーフレンドリーなインターフェースと堅実なパフォーマンスを提供します。ただし、無料ユーザーは3回の変換までの制限があります。
- Google Document AIは、GoogleのAI駆動の文書処理ツールスイートの一部です。トレーニングなしで非常に優れた認識を提供し、迅速な変換のための良い選択肢になります。ツールを試すために$300の無料クレジットを取得できますが、継続的に使用するためには変換ごとに支払う必要があります。
- GrabTextは、写真、グラフィック、文書から手書きや印刷されたテキストをキャプチャし、編集可能なテキストに変換するシンプルなオンラインツールです。テキストをキャプチャし、自動修正(スペルや文法を含む)を適用し、さまざまな形式で変換されたテキストをエクスポートするというシンプルな3ステッププロセスを提供します。残念ながら、無料で使用するには友達を招待する必要があります。
Transkribusを選ぶか、上記の代替案のいずれかを選んでも、簡単に文書をデジタル化することができるでしょう。さらに多くのオプションを探している場合は、AndroidでOCRを使用して画像をテキストに変換する方法を学んでください。