Beschreibung

Frog steht unter der MIT-Lizenz und liest komplexe Texte aus Fotos, Videos, Websites und QR-Codes aus. Es unterstützt die Aufnahme von Screenshots, kann aber auch Bilder direkt auslesen. Die Decodierung von QR-Codes wird ebenfalls unterstützt. Hierbei kommt die freie Tesseract-OCR Engine zum Einsatz.
Die zugehörigen Sprachmodule werden aus dem Tesseract-Repository heruntergeladen, der OCR-Prozess erfolgt lokal.

Installation

Frog gibt es als Flatpak und Snap-Paket. Das Flatpak installieren Sie mit folgenden Befehl:

flatpak install flathub com.github.tenderowl.frog

Nach der Installation empfiehlt sich das Herunterladen der gewünschten Sprachen.
Dies geschieht über das Dreipunkt-Menü: Preferences, Languages

Frog

Es steht eine Vielzahl von Sprachen zur Verfügung – der Download dauert nur ein paar Augenblicke…

Frog
Frog

Anwendung

Nun öffnet man entweder ein bestehendes Bild, oder erstellt einen Screenshot eines Fotos, Videos, PDFs, usw.
Für den Screenshot wird das Standardwerkzeug der eigenen Desktop-Umgebung verwendet. Nach dem Erstellen des Screenshots erlaubt man mit einem Klick die
Weitergabe der Aufnahme an Frog.

Frog – Anwendung

Folgendes Muster-Bild wurde ausgewählt…

Muster – Bilddatei

Frog beginnt sofort mit der Text-Extraktion und stellt das Ergebnis in einem Textfenster dar…

Frog – Auswertung
Frog – Auswertung

Der extrahierte Text kann nun sofort in die Zwischenablage kopiert und weiterverarbeitet werden – oder man lässt sich über das Lautsprecher-Symbol den Text vorlesen.

Anmerkung

Frog ist ein sehr nützliches Tool, um Texte aus Bildern auszulesen. Die Verwendung von Tesseract gestaltet sich hier unkompliziert und relativ fehlerfrei.
Positiv ist anzuführen, dass die Verarbeitung lokal stattfindet.

Gefällt mir 1
Gefällt mir nicht 0

Schreibe einen Kommentar

5 Reaktionen

  1. GImageReader Texterkennung und Tesseract für OCR-OCRFeeder
    Seit Windows 98 benutze ich Programme für OCR Texterkennung. Das Programm das ich benutzte war nicht unter Linux Nutzbar. Das erste Programm was ich für Linux fand war tesseract-ocr. Die Grafische Oberfläche gefiel mir nicht und der erkannte Text war schlecht. Ich musste den Text immer bearbeiten. Danach fand ich OCRFeeder. Der erkannte Text war etwas besser aber für mich nicht gut genug. Dann fand ich GimageReader. Dieses Programm kommt ziemlich dicht an das Programm das ich unter Windows benutzt hatte. Oben zwei Menüzeilen darunter drei Spalten zum Bearbeiten.
    Tesseract-ocr muss für beide Programme Installiert werden. Dieses Paket ist wichtig für Sprachen.
    apt install tesseract-ocr tesseract-ocr-deu

    1
    0
  2. Sowohl OCRFeeder als auch GImageReader verwenden Tesseract-OCR – ein Kommandozeilenprogramm ohne GUI – zur Texterkennung.
    Beide Tools sind schon ziemlich in die Jahre gekommen – die Anwendung umständlich.
    Mit Naps2 sowie Frog gelingen sehr gute Ergebnisse relativ unkompliziert. Normcap sei hier ebenfalls noch erwähnt.
    Zu allen Tools gibt es hier Beiträge.

  3. Vielen Dank für deine Info zebolon.
    Ich benutze GimageReader hauptsächlich für Fotos von meinem Handy und, oder Screenshots vom Desktop wenn ich nicht Drucken kann. Dann möchte ich den Text. Dafür ist GimageReader ausreichend.
    Für professionelle Ausgaben sind andere Programme besser geeignet.

Neue Themen im Forum
Statistik Juni 2024Die Entwicklung im WIKI im Juni 2024 Insgesamt sind 11 neue Beitr … Weiterlesen
Privatsphäre schützen:D Würde zu meinem Buch passen, das ich gerade schreibe. Weiterlesen
Clamwin-0.103.2.1-Windows11 finde …Unter einem laufenden Windows finden selbst Business-Malware-Scann … Weiterlesen
Kategorien im Wiki
WIKI-Beiträge des Monates

Die Beiträge des Monates finden Sie im Kalender unter den blau markierten Tageszahlen.

Oktober 2023
M D M D F S S
 1
2345678
9101112131415
16171819202122
23242526272829
3031  
Archive