Normale Ansicht

Es gibt neue verfügbare Artikel. Klicken Sie, um die Seite zu aktualisieren.
Ältere BeiträgeLinux-Magazin

OCR-Software Tesseract nutzt AVX512

08. Juli 2022 um 07:41

Tesseract ist eine quelloffene OCR-Engine, die Texte in Bildern und PDFs erkennt. Die neue Version 5.2.0 erhielt zwar nur kleinere Änderungen, beschleunigt aber erstmals mit der Befehlssatzerweiterung AVX512 ihre Berechnungen.

Konkret nutzt Tesseract Intels AVX512F. Bei ersten, aber nicht repräsentativen Tests der Entwickler lieferte dies eine Beschleunigung von 10 Prozent. Im Vergleich arbeitet Tesseract auf einem Apple M1-Prozessor aber immer noch schneller. Dort nutzt die OCR-Engine Neon zur Beschleunigung. Die Implementierung der AVX512-Unterstützung steht allerdings noch am Anfang.

Neben dieser Neuerung gab es nur Fehlerkorrekturen und kleinere Änderungen. So kommt Tesseract 5.2.0 jetzt auf 32-Bit-Systemen besser mit größeren PDFs zurecht. Des Weiteren gibt es den neuen Parameter „invert_threshold“ und der standardmäßig eingestellte Threshold klettert von 0,5 auf 0,7. Abschließend haben die Entwickler die Dokumentation verbessert.

Der Beitrag OCR-Software Tesseract nutzt AVX512 erschien zuerst auf Linux-Magazin.

❌
❌