Normale Ansicht

Es gibt neue verfügbare Artikel. Klicken Sie, um die Seite zu aktualisieren.
Ältere BeiträgeHaupt-Feeds

PDF OCR funktioniert gut mit ocrmypdf

Von: jdo
01. Dezember 2023 um 07:39

Eine Bekannte von mir hat ein altes Buch als PDF-Format (Bilder / Scan), das sie benötigt, um eine Arbeit zu schreiben. Das Buch ist auf Deutsch und sie muss Teile davon übersetzen. Dafür benutzt sie DeepL. Das Problem ist aber, dass sie keine Textpassagen kopieren kann, da das Dokument nicht als Text vorliegt. Eine OCR-Software hat geholfen. Ich habe ihr gesagt, dass wir es durch eine OCR-Software laufen lassen können. Das mag zwar nicht 100 % genau sein, aber sie […]

Der Beitrag PDF OCR funktioniert gut mit ocrmypdf ist von bitblokes.de.

OCR-Software Tesseract nutzt AVX512

08. Juli 2022 um 07:41

Tesseract ist eine quelloffene OCR-Engine, die Texte in Bildern und PDFs erkennt. Die neue Version 5.2.0 erhielt zwar nur kleinere Änderungen, beschleunigt aber erstmals mit der Befehlssatzerweiterung AVX512 ihre Berechnungen.

Konkret nutzt Tesseract Intels AVX512F. Bei ersten, aber nicht repräsentativen Tests der Entwickler lieferte dies eine Beschleunigung von 10 Prozent. Im Vergleich arbeitet Tesseract auf einem Apple M1-Prozessor aber immer noch schneller. Dort nutzt die OCR-Engine Neon zur Beschleunigung. Die Implementierung der AVX512-Unterstützung steht allerdings noch am Anfang.

Neben dieser Neuerung gab es nur Fehlerkorrekturen und kleinere Änderungen. So kommt Tesseract 5.2.0 jetzt auf 32-Bit-Systemen besser mit größeren PDFs zurecht. Des Weiteren gibt es den neuen Parameter „invert_threshold“ und der standardmäßig eingestellte Threshold klettert von 0,5 auf 0,7. Abschließend haben die Entwickler die Dokumentation verbessert.

Der Beitrag OCR-Software Tesseract nutzt AVX512 erschien zuerst auf Linux-Magazin.

❌
❌