손으로 쓴 문서를 텍스트로 변환하는 방법

디지털화되어 쉽게 편집, 공유 및 저장될 수 있도록 해주는 손으로 쓴 문서가 많이 있다면, 손글씨를 텍스트로 변환하는 기술(HTR)이 도움이 될 수 있습니다. 이를 통해 몇 가지 간단한 단계로 손으로 쓴 문서를 텍스트로 변환할 수 있으며, 필요한 것은 스캐너와 소프트웨어입니다.
목차
- 손글씨 문서 스캔의 도전
- Transkribus를 사용하여 손글씨 문서를 텍스트로 변환하기
- Transkribus 대안
손글씨 문서 스캔의 도전
손으로 쓴 문서를 스캔하여 디지털 텍스트로 변환하는 것은 정말 어려울 수 있습니다. 다음과 같은 고유한 도전 과제가 따릅니다:
- 사람마다 손글씨가 다르기 때문에 표준 광학 문자 인식(OCR) 소프트웨어가 텍스트를 정확하게 인식하고 전사하기가 어려워집니다.
- 손으로 쓴 문서에는 지운 단어와 맞춤법 오류와 같이 오류가 포함되어 있어 스캔 소프트웨어를 혼돈스럽게 만들 수 있습니다.
- 손으로 쓴 많은 문서들이 오래되어 종이, 사용된 잉크, 심지어 남은 자국이나 접힘이 스캔 과정을 더 복잡하게 만들 수 있습니다.
이런 문제를 해결하기 위해 소프트웨어 개발자들은 손글씨를 텍스트로 변환하기 위해 특별히 설계된 손글씨 텍스트 변환(HTR) 소프트웨어를 만들었습니다.
HTR 도구는 다양한 손글씨 스타일에 적응하고, 의도된 텍스트와 남은 자국이나 수정 사항을 구별하며, 오래되거나 손상된 문서에 대처하기 위해 고급 알고리즘을 사용합니다.
Transkribus를 사용하여 손글씨 문서를 텍스트로 변환하기
손으로 쓴 문서를 텍스트로 변환할 수 있는 다양한 HTR 도구가 있지만, 제가 가장 추천하는 것은 Transkribus입니다. 매우 쉽게 사용할 수 있는 온라인 소프트웨어이며, 성능을 향상시키기 위해 학습할 수도 있습니다.
기본적으로 Transkribus의 결과는 기대 이하일 수 있습니다. 그러나 이 도구의 진정한 힘은 학습 인터페이스에 있습니다. 약간의 시간과 노력을 들이면 Transkribus를 당신의 손글씨를 더 정확하게 인식하도록 훈련할 수 있어 전사의 품질을 크게 개선할 수 있습니다.
Transkribus의 무료 버전은 최대 100개의 문서를 변환하고 한 달에 최대 5회의 학습을 수행할 수 있게 해줍니다(자세한 내용은 곧 설명하겠습니다). 시작하려면 도구의 웹사이트를 방문하고, 무료로 사용해보기 버튼을 클릭하여 사용자 계정을 생성하세요.

문서 변환을 시작하려면, Transkribus에서 기본 컬렉션을 엽니다. 컬렉션은 작업을 정리할 수 있는 폴더와 같으며, 각 컬렉션에는 개별 문서가 포함됩니다. 각 문서는 텍스트의 실제 페이지를 나타내는 이미지로 구성됩니다.

문서를 추가하려면 파일 업로드 버튼을 클릭하세요. Transkribus는 JPEG, PNG 및 PDF와 같은 다양한 형식을 지원하지만, 최적의 인식을 위해 300 DPI JPEG 사용을 권장합니다. 문서가 업로드되면, 손글씨 문서를 텍스트로 변환할 준비가 완료됩니다.

문서를 열고 변환하고 싶은 모든 이미지를 선택합니다. 인식하기 버튼을 클릭하세요.

Transkribus는 다양한 언어와 시간대에 대한 공공 모델을 제공합니다. 학습 없이 즉각적인 텍스트 인식을 위해 문서의 특성과 가장 잘 맞는 모델을 선택한 후 인식 시작 버튼을 클릭하고 기다리세요. 저는 The English Eagle 모델을 선택했습니다.

무료 사용자가 생성한 손글씨 텍스트 인식 작업은 낮은 우선 순위를 받기 때문에 Transkribus가 작업을 마치기까지 시간이 걸릴 수 있습니다.

인식 프로세스 후, Transkribus 문서 편집기를 사용하여 결과를 세밀하게 조정합니다. 이는 텍스트와 이미지 뷰를 동기화하여 직관적인 편집 프로세스를 제공합니다. 태그를 사용하여 개체, 이벤트 또는 불확실한 전사를 표시할 수 있습니다.
HTR 성능 향상을 위한 맞춤 모델 훈련하기
맞춤 모델을 훈련하려면, 실제 데이터를 준비해야 합니다. 이는 모델이 인식하기를 원하는 쓰기 스타일과 일치하는 손글씨 문서를 정확하게 전사하는 것을 포함합니다. 데이터가 다양하고 대표적일수록 모델의 성능이 향상됩니다.

모델을 훈련하려면 새 모델 훈련 버튼을 클릭합니다. 텍스트 인식 모델 옵션을 선택하고, 실제 문서가 포함된 컬렉션을 선택한 후 훈련 및 검증 데이터에 포함할 페이지를 선택합니다. 훈련 데이터는 모델의 매개변수를 조정하는 데 사용되고, 검증 데이터는 모델 성능의 편향되지 않은 평가를 제공합니다.

모델의 언어 및 문자 집합과 같은 설정을 구성하여 훈련 프로세스를 시작합니다. 이 과정에서는 모델이 데이터를 통해 학습하는 여러 사이클이나 “에포크”가 포함됩니다. 모델의 성능이 더 이상 향상되지 않으면 Transkribus는 자동으로 훈련을 중단합니다.
훈련 후, 개선된 정확도로 새로운 문서를 전사하기 위해 맞춤 모델을 사용할 수 있습니다.
Transkribus 대안
Transkribus가 손글씨 문서를 텍스트로 변환하는 데 가장 좋은 선택이지만, 다른 좋은 대안도 많이 있습니다:
- Pen2Txt는 HTR 분야의 신생 기업입니다. 최신 AI 기술을 활용하여 다양한 손글씨 스타일에 적절하게 맞춰 높은 정확도를 제공하는 것을 목표로 합니다. 진행 중인 작업이지만, 사용자 친화적인 인터페이스와 괜찮은 성능을 제공합니다. 다만 무료 사용자에게는 세 번의 변환만 허용됩니다.
- Google Document AI는 Google의 AI 기반 문서 처리 도구 모음의 일부입니다. 학습 없이도 탁월한 기본 인식을 제공하여 빠른 변환에 적합한 선택입니다. 이 도구를 사용해 보려면 $300의 무료 크레딧을 받을 수 있지만, 지속적으로 사용하려면 건당 비용을 지불해야 합니다.
- GrabText는 사진, 그래픽 및 문서에서 손으로 쓴 또는 인쇄된 텍스트를 캡처하고 이를 편집 가능한 텍스트로 변환하는 간단한 온라인 도구입니다. 텍스트를 캡처하고, 자동 수정(맞춤법 및 문법 포함)을 적용한 다음 다양한 형식으로 변환된 텍스트를 내보내는 직관적인 세 단계 프로세스를 제공합니다. 그러나 무료로 사용하려면 친구를 초대해야 합니다.
Transkribus를 선택하든 위의 대안 중 하나를 선택하든, 쉽게 문서를 디지털화할 수 있습니다. 더 많은 옵션을 찾고 있다면, Android에서 OCR을 사용하여 이미지를 텍스트로 변환하는 방법을 알아보세요.
이미지 제공: Pixabay. 모든 스크린샷 제공: David Morelo.