Immer wieder gibt es Texte, die sich nicht einfach kopieren und weiterverwenden lassen. Etwa in Pop-up-Fenstern, Titelleisten, Bildern auf einer Website, von Plakaten oder Tafeln. Oder man hat in einem Museum Begleittexte zu Ausstellungs-Objekten fotografiert. Diese Texte möchte man nicht abschreiben müssen. Aber man kann sie per OCR-Programm „herauslesen“ lassen. Ein solches Programm ist NormCap – die Website dazu: https://github.com/dynobo/normcap/

Installation

Das Programm gibt es als AppImage oder Python-Programm, und es wird auf seiner Website auch erklärt, wie man die Python-Version unter Linux installiert und startet (sogar eine Liste von ähnlichen Programmen wird präsentiert): zuerst die Abhängigkeiten installieren, dann das Python-Programm selbst über pipx.

Ubuntu/Debian:
sudo apt install build-essential tesseract-ocr tesseract-ocr-eng libtesseract-dev libleptonica-dev wl-clipboard

Arch:
sudo pacman -S tesseract tesseract-data-eng wl-clipboard

Fedora:
sudo dnf install tesseract wl-clipboard

openSUSE:
sudo zypper install python3-devel tesseract-ocr tesseract-ocr-devel wl-clipboard

Allenfalls muss zuerst pipx über die Paketverwaltung installiert werden, bevor man mit pipx NormCap installieren kann. Für Debian/Ubuntu:
sudo apt install pipx

Danach (ohne sudo):
pipx install normcap

Benützung

Der Pfad zur Startdatei normcap – damit lässt sich das Programm über das Terminal starten (einen Eintrag im Startmenü gibt es nicht, den kann man aber selbst erstellen):
~/.local/pipx/venvs/normcap/bin/normcap

Wenn sich das Programm nicht starten lässt, muss man einiges nachinstallieren: 
Debian/Ubuntu/Mint/OpenSuse: libxcb1 libxcb-cursor0
– Arch/Manjaro/Fedora/CentOS: libxcb xcb-util-cursor

Hat man auch damit keinen Erfolg, kann man auf der Download-Seite das AppImage herunterladen und es damit versuchen.

Ein animiertes GIF-Bild auf der Download-Seite zeigt, wie man das Programm benützt. Auch beim Starten öffnet sich eine Informationsfenster mit einer Anweisung (in Englisch). Hier dennoch ein kurzer Text dazu:

1) Das Programm starten und warten, bis man einen roten Rahmen überall am Monitorrand sieht. Der Cursor verwandelt sich in ein Kreuz.
2) Man kann um den Text auf dem Bild einen Rahmen ziehen (mit der linken gedrückten Maustaste links oben anfangen und loslassen, wenn man den ganzen Text „eingefangen“ hat).
3) In der rechten oberen Ecke des Monitors wird darauf mit einem Pop-up angezeigt, wie viele Wörter man ausgewählt hat. Und der Text befindet sich jetzt in der Zwischenablage, sodass man ihn in ein Textprogramm oder einen Texteditor einfügen kann.

Beispiel

Technik-Museum Speyer – Erklärung zu Diesellok V200

Das Ergebnis von NormCap, unbearbeitet von mir – auffällig sind die (ungewollten) Trennstriche und Wortabstände in einigen Wörtern, z.B. in „vor- gestellt“:

Krauss-Maffei Diesellokomotive V200
Baujahr: 1959 Leistung: 2x 1000 PS Höchstgeschw. 140 km/h
Technik Museen Sinsheim Speyer
x
DE
Die erste von Krauss-Maffei gebaute V 200 Diesellokomoti- ve wurde 1953 auf der MUnchner Verkehrsausstellung vor- gestellt. Gemäß den Auflagen der Deutschen Bahn konnten Motoren von drei Herstellerfirmen eingebaut werden, die auch untereinander frei austauschbar waren. Es handelte sich um 12-Zylinder V Dieselmotoren der Firmen Maybach, Mercedes-Benz und MAN.
EN
The first V 200 diesel locomotive built by Krauss-Maffei was presented at the Munich Transport Exhibition in 1953. In accordance with the requirements of Deutsche Bahn, en- gines from three manufacturers could be installed, which were also freely interchangeable. These were 12-cylinder V diesel engines from Maybach, Mercedes-Benz and MAN.
©

Einstellungen

Beim Starten des Programms taucht zusammen mit dem roten Rand ein kleines rotes Zahnrad in der rechten oberen Monitor-Ecke auf, darüber erreicht man die Einstellungen:

Show notification – ein Pop-up-Fensterchen nach dem Kopieren anzeigen, damit man weiss, ob die Erfassung funktionierte
Keep in system tray – In der Taskleiste wird das NormCap-Symbol eingerichtet (bis zum Runterfahren). Klickt man es mit der gedrückten linken Maustaste an,  kann man weitere Textkopien erzeugen, mit der rechten Maustaste hat man die Wahl zwischen „capture“  und „exit“ (Programm beenden).
parse – strukturiert darstellen. Das ist nützlich, wenn man die Auswahl auf zwei oder mehr Textspalten ausdehnt, die werden dann untereinander dargestellt, wenn man sie in einen Texteditor reinkopiert.
raw – unbearbeitet, fortlaufend darstellen. Das ist nützlich, wenn man den Text einer Spalte in z.B. LibreOffice Writer einfügt, man erhält dann keine ungewollten Zeilenende-Zeichen.
Languagesselect Mit Haken die Sprachen des Bildes angeben.
… need more? – Sprachen hinzufügen, die NormCap erkennen soll, und zwar zuerst tesseract installieren – in Debian geht das so …

sudo apt install tesseract

… dann beispielsweise Italienisch, Französisch, Spanisch, deutsche Frakturschrift (und, wenn nicht schon geschehen, Deutsch und Englisch) hinzufügen:

sudo apt install tesseract-ocr-ita tesseract-ocr-fra tesseract-ocr-spa tesseract-ocr-deu-frak tesseract-ocr-deu tesseract-ocr-eng 

about – Introduction, Website, FAQs usw.

Kleiner Tipp zum Schluss: Vor dem Gebrauch von NormCap kann Abwedeln/Nachbelichten, Kontrast verstärken (z.B. in Gimp) helfen, das Resultat zu verbessern. Bei der Anwendung kann man auch die Ansicht des Bildes inkl. Schrift vergrössern.


Aktualisiert am 31. Dezember 2023

Categories:

Tags:

Schreibe einen Kommentar

Noch keine Reaktion

Neue Themen im Forum
Frage zu GrubDanke @juhu, das war für mich eine reine Verständnisfrage allge … Weiterlesen
Brother Drucker unter LinuxMit der Suche nach „Linux Brother HL-2030“ fand ich zur Seite htt … Weiterlesen
DebianJetzt klappt's! Das Problem war das Erstellen einer EFI-Sy … Weiterlesen
Kategorien im Wiki
WIKI-Beiträge des Monates

Die Beiträge des Monates finden Sie im Kalender unter den blau markierten Tageszahlen.

September 2023
M D M D F S S
 123
45678910
11121314151617
18192021222324
252627282930  
Archive