Immer wieder gibt es Texte, die sich nicht einfach kopieren und weiterverwenden lassen. Etwa in Pop-up-Fenstern, Titelleisten, Bildern auf einer Website, von Plakaten oder Tafeln. Oder man hat in einem Museum Begleittexte zu Ausstellungs-Objekten fotografiert. Diese Texte möchte man nicht abschreiben müssen. Aber man kann sie per OCR-Programm „herauslesen“ lassen. Ein solches Programm ist NormCap – die Website dazu: https://github.com/dynobo/normcap/
Inhaltsverzeichnis
Installation
Das Programm gibt es als AppImage oder Python-Programm, und es wird auf seiner Website auch erklärt, wie man die Python-Version unter Linux installiert und startet (sogar eine Liste von ähnlichen Programmen wird präsentiert): zuerst die Abhängigkeiten installieren, dann das Python-Programm selbst über pipx.
Ubuntu/Debian:
sudo apt install build-essential tesseract-ocr tesseract-ocr-eng libtesseract-dev libleptonica-dev wl-clipboard
Arch:
sudo pacman -S tesseract tesseract-data-eng wl-clipboard
Fedora:
sudo dnf install tesseract wl-clipboard
openSUSE:
sudo zypper install python3-devel tesseract-ocr tesseract-ocr-devel wl-clipboard
Allenfalls muss zuerst pipx über die Paketverwaltung installiert werden, bevor man mit pipx NormCap installieren kann. Für Debian/Ubuntu:
sudo apt install pipx
Danach (ohne sudo):
pipx install normcap
Benützung
Der Pfad zur Startdatei normcap – damit lässt sich das Programm über das Terminal starten (einen Eintrag im Startmenü gibt es nicht, den kann man aber selbst erstellen):
~/.local/pipx/venvs/normcap/bin/normcap
Wenn sich das Programm nicht starten lässt, muss man einiges nachinstallieren:
– Debian/Ubuntu/Mint/OpenSuse: libxcb1 libxcb-cursor0
– Arch/Manjaro/Fedora/CentOS: libxcb xcb-util-cursor
Hat man auch damit keinen Erfolg, kann man auf der Download-Seite das AppImage herunterladen und es damit versuchen.
Ein animiertes GIF-Bild auf der Download-Seite zeigt, wie man das Programm benützt. Auch beim Starten öffnet sich eine Informationsfenster mit einer Anweisung (in Englisch). Hier dennoch ein kurzer Text dazu:
1) Das Programm starten und warten, bis man einen roten Rahmen überall am Monitorrand sieht. Der Cursor verwandelt sich in ein Kreuz.
2) Man kann um den Text auf dem Bild einen Rahmen ziehen (mit der linken gedrückten Maustaste links oben anfangen und loslassen, wenn man den ganzen Text „eingefangen“ hat).
3) In der rechten oberen Ecke des Monitors wird darauf mit einem Pop-up angezeigt, wie viele Wörter man ausgewählt hat. Und der Text befindet sich jetzt in der Zwischenablage, sodass man ihn in ein Textprogramm oder einen Texteditor einfügen kann.
Beispiel
Das Ergebnis von NormCap, unbearbeitet von mir – auffällig sind die (ungewollten) Trennstriche und Wortabstände in einigen Wörtern, z.B. in „vor- gestellt“:
Krauss-Maffei Diesellokomotive V200
Baujahr: 1959 Leistung: 2x 1000 PS Höchstgeschw. 140 km/h
Technik Museen Sinsheim Speyer
x
DE
Die erste von Krauss-Maffei gebaute V 200 Diesellokomoti- ve wurde 1953 auf der MUnchner Verkehrsausstellung vor- gestellt. Gemäß den Auflagen der Deutschen Bahn konnten Motoren von drei Herstellerfirmen eingebaut werden, die auch untereinander frei austauschbar waren. Es handelte sich um 12-Zylinder V Dieselmotoren der Firmen Maybach, Mercedes-Benz und MAN.
EN
The first V 200 diesel locomotive built by Krauss-Maffei was presented at the Munich Transport Exhibition in 1953. In accordance with the requirements of Deutsche Bahn, en- gines from three manufacturers could be installed, which were also freely interchangeable. These were 12-cylinder V diesel engines from Maybach, Mercedes-Benz and MAN.
©
Einstellungen
Beim Starten des Programms taucht zusammen mit dem roten Rand ein kleines rotes Zahnrad in der rechten oberen Monitor-Ecke auf, darüber erreicht man die Einstellungen:
Show notification – ein Pop-up-Fensterchen nach dem Kopieren anzeigen, damit man weiss, ob die Erfassung funktionierte
Keep in system tray – In der Taskleiste wird das NormCap-Symbol eingerichtet (bis zum Runterfahren). Klickt man es mit der gedrückten linken Maustaste an, kann man weitere Textkopien erzeugen, mit der rechten Maustaste hat man die Wahl zwischen „capture“ und „exit“ (Programm beenden).
parse – strukturiert darstellen. Das ist nützlich, wenn man die Auswahl auf zwei oder mehr Textspalten ausdehnt, die werden dann untereinander dargestellt, wenn man sie in einen Texteditor reinkopiert.
raw – unbearbeitet, fortlaufend darstellen. Das ist nützlich, wenn man den Text einer Spalte in z.B. LibreOffice Writer einfügt, man erhält dann keine ungewollten Zeilenende-Zeichen.
Languages → select Mit Haken die Sprachen des Bildes angeben.
… need more? – Sprachen hinzufügen, die NormCap erkennen soll, und zwar zuerst tesseract installieren – in Debian geht das so …
sudo apt install tesseract
… dann beispielsweise Italienisch, Französisch, Spanisch, deutsche Frakturschrift (und, wenn nicht schon geschehen, Deutsch und Englisch) hinzufügen:
sudo apt install tesseract-ocr-ita tesseract-ocr-fra tesseract-ocr-spa tesseract-ocr-deu-frak tesseract-ocr-deu tesseract-ocr-eng
about – Introduction, Website, FAQs usw.
Kleiner Tipp zum Schluss: Vor dem Gebrauch von NormCap kann Abwedeln/Nachbelichten, Kontrast verstärken (z.B. in Gimp) helfen, das Resultat zu verbessern. Bei der Anwendung kann man auch die Ansicht des Bildes inkl. Schrift vergrössern.
Aktualisiert am 31. Dezember 2023
Noch keine Reaktion