Textshot ist mit NormCap verwandt, ist aber ein Terminal-Programm ohne GUI.

Seine Screenshot-Texte gehen wie bei NormCap in die Zwischenablage, zusätzlich sind sie im Terminal sichtbar.

Und Textshot kann sogar Screenshots in Intervallen (automatisch) produzieren, die dann im Terminal untereinander erscheinen. Benutzt man die Intervall-Funktion, ist ein Programm wie Clipit oder Diodon von Vorteil, sonst verliert man den Text der Zwischenablage bei jedem neuen Screenshot (wenigstens aber nicht den identischen Text im Terminal).

Leider hat man keinen bleibenden sichtbaren Auswahlrahmen, wie ihn NormCap hat.

In Erinnerung zu rufen ist hier, dass Screenshots natürlich von Texten in Bildern wie von „echten“ Texten gemacht werden können. Eigentlich selbstverständlich.

Mehr zum Programm Textshot hier: https://github.com/ianzhao05/textshot

Die Installation mit pip (die Installation von Tesseract mit den richtigen Sprachen ist Voraussetzung und ebenso, dass Tesseract von der Kommandozeile aus ansprechbar ist – mehr dazu dort, wo der Link hinführt):

pip install textshot

Der Gebrauch auf der Kommandozeile:

textshot "deu+eng"

Der Befehl mit Intervall-Option:

textshot --interval 200

oder

textshot "deu+eng" --interval 200

wobei Englisch Standardeinstellung ist und bei einem rein englischen Text „eng“ (mit Anführungszeichen) nicht gesetzt werden muss, „deu“ aber bei einem rein deutschen Text schon. Die Option 200 = 200 Millisekunden – 1000 = 1 Sekunde.

Man kann Textshot direkt starten, ohne das Terminal zu öffnen, wenn man eine Tastenkombi anlegt – unter Xfce so:
EinstellungenTastaturTastenkürzel für Anwendungen → Add usw. Unter Xfce kann man auch das Programmmenü öffnen und textshot schreiben und Enter drücken.

Ein Vergleich der Ergebnisse von NormCap (RAW bzw. PARSE) und Textshot, wenn ich den Text aus der Zwischenablage in LibreOffice Writer hineinkopiere:

Textshot-Text in LibreOffice Writer enthält Absatz-Ende-Zeichen (sichtbar bei der Einstellung sichtbar) an jedem Zeilenende. Das ist unter Umständen sehr störend. Möchte man viele Texte so aus Bildern oder aus gescannten PDF-Seiten „herausholen“ und etwa in Writer weiterbearbeiten, kann es viel Arbeit bedeuten, die meisten dieser Absatz-Ende-Zeichen wieder zu entfernen. Ideal wäre es, die Einstellung Parse von NormCap mit der Intervall-Funktion von Textshot zu kombinieren. Andernfalls wäre für viele Seiten hintereinander – etwa ein Buch – das Programm OCRmyPDF (mit der sidecar-Option eine zusätzliche Textdatei erzeugend) eine gute Wahl, aber auch dieses Programm setzt solche Absatz-Ende-Zeichen.


Erstveröffentlichung: Mi 5. Apr 2023, 00:56

Tags:

Schreibe einen Kommentar

Noch keine Reaktion

Neue Themen im Forum
Meldung, wenn NFS Share nicht err …Zitat von zebolon am 22. November 2024, 16:27 Uhr Hallo @linuxopa … Weiterlesen
Debian installieren - für Anfänge …Danke LinuxBiber, das hilft gut weiter. Wenn da aber für den De … Weiterlesen
Frage zu GrubDanke @juhu, das war für mich eine reine Verständnisfrage allge … Weiterlesen
Kategorien im Wiki
WIKI-Beiträge des Monates

Die Beiträge des Monates finden Sie im Kalender unter den blau markierten Tageszahlen.

September 2023
M D M D F S S
 123
45678910
11121314151617
18192021222324
252627282930  
Archive