[gelöst] Nachträgliche Gliederung von PDF-Dokumenten
Zitat von LinuxBiber am 3. Oktober 2023, 12:36 UhrAuszüge aus dem Archiv!
von markusbuech » Di 24. Jan 2023, 15:37
Hallo zusammen,
kann man bei PDF-Dokumenten nachträglich eine Gliederung erstellen? Bei fertigen eBooks wird sowas wohl von der Erstellersoftware erstellt (hab da so eine Option z.B. in LibreOffice gesehen).
Bei mir geht es aber darum, dass ich des öftern aus mehren kleinen PDF-Dokumenten eine grössere mache und da dann keine Gliederung zur einfachen Navigation vorhanden ist. Konkretes Beispiel sind z.B. meine Kontoauszüge. Jeden Monat bekomme ich davon eine PDF-Datei, sprich zwölf im ganzen Jahr. Der Einfachheithalber erstelle ich mir dann eine für's ganze Jahr (PDF-Arranger). Wenn ich dann aber zu einem bestimmten Monat will, muss ich halt scrollen. Ist jetzt nur ein Bespiel, geht auch um andere PDF-Dokumente solcher Art.
Gibt es für sowar eine Software oder ein Konsolenprogramm? Schön wäre es, wenn ich den einzelen Gliederungspunkten Namen geben könne.
Vielen Dank
Markus
von LinuxOpa » Di 24. Jan 2023, 16:18
von LinuxBiber » Di 24. Jan 2023, 17:54
Ich habe folgendes gefunden und ausprobiert.
(Quelle meiner Erleuchtung war Vorstellung von PDF-Programmen im Wiki ubuntuusers.de )
Könnte für deine Fragestellung passen.
Für eine längere Vorstellung fehlt mir jetzt die Zeit.
JPdfBookmarks
Das Programm setzt auch Java voraus.
Viel Erfolg!
von Rocki » Mi 25. Jan 2023, 01:57
Eine andere Vorgehensweise als deine (markusbuech): Ich benütze seit Jahresende Paperwork und bin beeindruckt. Robert hat das Programm hier mal vorgestellt: Man kann es einfach mit Dokumenten füttern (per PDF- oder Bild-Import oder Scan), die werden sofort OCR-gescannt, zusätzlich kann man noch ein Datum eingeben, eigene Tags (z.B. "Banken", "Arbeit") und in einem Eingabefeld eigene Wörter, die einem das Finden erleichtern. Jedes Dokument wird zusammen mit der Textdatei usw. in einem eigenen Ordner (Verzeichnis) gespeichert. Alle diese Ordner wiederum werden in einen übergelagerten Ordner eingefügt, den Ordner "papers". Wo dieser Ordner namens "papers" sich befindet (auch z.B. auf einem USB-Stick), kann man selber bestimmen, umtaufen kann man ihn auch. Grundsätzlich werden die Dokumente nicht sortiert (nur mit Datum), aber per Suche findet man alles sehr schnell. Die Suche sucht in den Texten der Dokumente und unter den zusätzlich eingegebenen Wörtern und reiht alle so gefundenen Dokumente in der linken Spalte auf. Jedes Dokument kann man exportieren, wenn man das nötig findet, die OCR-Schicht bleibt erhalten. Ich habe hier nicht alles aufgeführt, was das Programm kann, aber es bleiben kaum Wünsche unerfüllt. Und eine gut verständliche, ausführliche deutsche Hilfe gehört zum Programm dazu.
von markusbuech » Mi 25. Jan 2023, 10:17
@LinuxOpa - Wenn ich in LO Draw die PDF-Datei öffne werden so gut wie alle Grafiken zerschossen. Beim speichern
wird dann eine Gliederung angelegt, aber für alle Seiten, egal ob auch nur eine einzelnen Link einfüge. Oder ich mache da was falsch.@LinuxBiber - Das scheint soweit mit dem Programm zu funktionieren. Bei einer Testdatei konnte ich zwei Verlinkungen bzw. Bookmarks wie es da ja heisst erstellen und seperat aufrufen. Ich werde mal ein paar grössere Dateien noch testen.@Rocki - Ich kenne Paperwork bzw. habe es versucht, aber bei meinem Rechner stürzt das Programm immer mit der Zeit ab, egal ob aus den Manjaroquellen oder per Flatpak. Auch konnte ich eine geöffnete Datei nicht schliessen. Wenn aber für jedes Dokument ein eigenes Verzeichnis erstellt wird, wäre das auch nichts für mich, da ich ziemlich viele PDF-Dokumente habe. Eigentlich bräuchte ich sowas wie eine Dokumenten-Mangament-Software, aber sowas habe ich unter Linux noch nicht gefunden.Ich Danke euch vieren für eure Unterstützung. Ich werde JPdfBookmarks ein wenig mehr testen und dann nochmal berichten.
von Rocki » Mi 25. Jan 2023, 11:33
Die vielen Ordner in Paperwork sind kein Problem. Aber wenn es andere Schwierigkeiten gibt, dann ist eine andere Lösung vielleicht besser.
Such doch mal hier:
https://alternativeto.net/software/pdf-search/
oder hier:
https://wiki.archlinux.org/title/List_of_applications
oder hier:
https://rainerstoll.at/links/buerotools ... sprozesse/
oder hier:
https://www.ubit-stmk.at/ubit-bildungsp ... en_source/Viel Glück!
von zebolon » Mi 25. Jan 2023, 15:29
Für den privaten Einsatz sind DMS (Datei-Management-Systeme) eigentlich viel zu aufgebläht und träge.
Zu den genannten Zweck eignet sich z. B. ZIM sehr gut. Hier erstellt man sich eine Gliederung nach eigenen Vorstellungen.Zu den einzelnen PDF-Dateien (oder fast jeden anderen Dateityp) kann eine Verknüpfung erstellt und per Mausklick im Standard-Programm geöffnet werden. Ergänzende Notizen oder Screenshots zu den jeweilgen Dokumenten sind ebenso möglich.
Ein weiterer Vorteil - ZIM arbeitet ohne Datenbanken.
von LinuxBiber » Do 26. Jan 2023, 21:44
Zu dem Thema habe ich einen Beitrag in "Büro" fertig gestellt.
JPdfBookmarks - Gliederung in PDF nachträglich setzen
von markusbuech » Di 7. Feb 2023, 18:17
@Rocki Danke für die Links. Auf der archlinux-Seite hatte ich das Programm "Bookworm" gefunden, da dort steht, man könne damit PDF und so verwalten. Aber warum auch immer zerschiesst es mir da das Original-PDF-Layout. Mit "Calibre" werd ich nicht zurecht war und "Gnome Books" hat leider keine PDF-Unterstützung. Ich werde mal weiter suchen.
@zebolon Ich habe den Begriff "Dokumenten-Managment-Software" wohl etwas falsch gewählt, obwohl es schon in die Richtung gehen soll. Ich suche ein Programm, womit ich meine Dokumente (PDF's) verwalten kann. Ich möchte z.B. Themen-Sammlungen erstellen und dort dann die PDFs zuweisen. Manche Datei passt aber auch zu zwei oder mehrern Themen, möchte aber jetzt keine unnötige Kopien im Dateisystem haben. Vor zwanzig Jahren in meiner damaligen noch-Windows-Ära hatte ich mal iTunes für meine MP3-Dateien. Es las den Musikordner ein, ich konnte sowhl durch die Ordnerstruktur als auch durch eigene Sammlungen browsen. Das tolle war, es merkte sich, wenn ich wo mal unterbrochen bzw. aufgehört habe (Hörbuch). Soetwas wünsche ich mir analgo für andere Dateitypen wie Videos, Musik, Bilder, Dokumente, ect. Bei ePub-Dateien benutze ich z.B. "Foliate". Das merkt sich zu jeder Datei wie weit ich gelesen haben. Eigentlich wollte ich sowas in der Art mal mit Nextcloud machen, aber Nextcloud ist doch irgendwie komplizierter als ich dachte und finde da auch nicht so die Infos zu.
Kann man bei Zim bei einer Verknüpfung auf einer PDF-Datei auf eine bestimmte Seite in dieser Datei verweisen? Also z.B. bei einer Zeitschrift auf einen bestimmten Artikel?
@LinuxBiber Das Programm funktioniert bei mir ganz gut. Wäre ich des Englischen mächtig, würde ich bei den "PDF Arranger" Leuten mal anfragen, ob sowas nicht bei denen ein Feature für eine zukünftige Version sein könnte.
von Alexs » Di 7. Feb 2023, 20:40
markusbuech hat geschrieben: Di 7. Feb 2023, 18:17 (…) Ich suche ein Programm, womit ich meine Dokumente (PDF's) verwalten kann. Ich möchte z.B. Themen-Sammlungen erstellen und dort dann die PDFs zuweisen. Manche Datei passt aber auch zu zwei oder mehrern Themen, möchte aber jetzt keine unnötige Kopien im Dateisystem haben.Versuche dich näher mit Calibre zu befassen, die Software ist ja dazu gedacht eBook-Dateien (aber auch andere Dateien) zu verwalten und mit Hilfe den sogenannten Schlagwörtern (tags) – bei die wären das Themen – kann man diese sortieren, oder besser noch, man lässt die Dateien in sogenannten Virtuellen Bibliotheken anzeigen.
Wenn man ein PDF in Calibre hinzufügt, dann existiert davon nur eine Kopie im Calibre-Ordner (Calibre-Bibliothek), eine virtuellen Bibliothek zeigt dieses dann zusätzlich anhand des gewünschten Suchmusters zB. Schlagwörtern an.
Somit fügst du zuerst ein PDF in Calibre hinzu, danach unter Metadaten kommen die gewünschten Schlagwörtern (tags) – bei mehrere durch ein Komma getrennt – in das betreffende Feld hinein.
Bei einer Rezept-Bibliothek für das gschmackige und einfache Gericht Krautfleckerl, kann man folgende Schlagwörter verwenden:
Österreich, Hauptspeise, Nudeln, Kraut, Vegan
Damit alleine kann man schon nur mit dem Krautfleckerl-Rezept 5 virtuelle Bibliotheken anzeigen lassen und nun nimm 50 verschiedene Rezepte dazu.Der Nachteil ist halt, dass innerhalb der Calibre-Bibliothek keine richtige Ordnerstruktur existiert, aber seit ich meine eBooks ausschließlich mit Calibre verwalte, stört mich das nichts im geringsten.
Ich habe übrigens dazu einen Thread geschrieben:
Calibre und weitere Verwendungsmöglichkeiten
Und man kann mit den mitinstallierten eBook-Viewer auch PDF lesen.Ansonsten gibt es dazu das Handbuch zum nachlesen auf Deutsch:
https://manual.calibre-ebook.com/de/vir ... aries.html
https://manual.calibre-ebook.com/de/viewer.html
von robertgoedl » Do 9. Feb 2023, 17:49
Ich habe jetzt nicht gelesen, um welche Desktop-Umgebung es jetzt geht - aber versuche einmal die Software Basket. Einfach mal reinklicken, Dateien rein verschieben, rechts klicken - verknüpfen - da bieten sich unendlich viele Möglichkeiten.
Habe gestern gerade einen Beitrag von 2017 über Paperwork angesehen und finde vor allem den Schluss (Seite 3) interessant: Titel Paperwork-Alternativen. Da wird Calibre auch lobend erwähnt:
"Für die Aufnahme von Text-PDF-Dokumenten in eine Datenbank bedarf es eigentlich fast keiner Vorarbeiten: Programme wie Calibre [10] machen das ohne Probleme, und zwar oft fehlerfrei. Obwohl eigentlich zum Verwalten von E-Books entwickelt, nimmt das Programm Text-, HTML-, ODT- sowie PDF-Dokumente auf und zeigt diese an."
Quelle: https://www.linux-community.de/ausgaben ... -papier/3/
Auszüge aus dem Archiv!
von markusbuech » Di 24. Jan 2023, 15:37
Hallo zusammen,
kann man bei PDF-Dokumenten nachträglich eine Gliederung erstellen? Bei fertigen eBooks wird sowas wohl von der Erstellersoftware erstellt (hab da so eine Option z.B. in LibreOffice gesehen).
Bei mir geht es aber darum, dass ich des öftern aus mehren kleinen PDF-Dokumenten eine grössere mache und da dann keine Gliederung zur einfachen Navigation vorhanden ist. Konkretes Beispiel sind z.B. meine Kontoauszüge. Jeden Monat bekomme ich davon eine PDF-Datei, sprich zwölf im ganzen Jahr. Der Einfachheithalber erstelle ich mir dann eine für's ganze Jahr (PDF-Arranger). Wenn ich dann aber zu einem bestimmten Monat will, muss ich halt scrollen. Ist jetzt nur ein Bespiel, geht auch um andere PDF-Dokumente solcher Art.
Gibt es für sowar eine Software oder ein Konsolenprogramm? Schön wäre es, wenn ich den einzelen Gliederungspunkten Namen geben könne.
Vielen Dank
Markus
von LinuxOpa » Di 24. Jan 2023, 16:18
von LinuxBiber » Di 24. Jan 2023, 17:54
(Quelle meiner Erleuchtung war Vorstellung von PDF-Programmen im Wiki ubuntuusers.de )
Könnte für deine Fragestellung passen.
Für eine längere Vorstellung fehlt mir jetzt die Zeit.
JPdfBookmarks
Das Programm setzt auch Java voraus.
Viel Erfolg!
von Rocki » Mi 25. Jan 2023, 01:57
Eine andere Vorgehensweise als deine (markusbuech): Ich benütze seit Jahresende Paperwork und bin beeindruckt. Robert hat das Programm hier mal vorgestellt: Man kann es einfach mit Dokumenten füttern (per PDF- oder Bild-Import oder Scan), die werden sofort OCR-gescannt, zusätzlich kann man noch ein Datum eingeben, eigene Tags (z.B. "Banken", "Arbeit") und in einem Eingabefeld eigene Wörter, die einem das Finden erleichtern. Jedes Dokument wird zusammen mit der Textdatei usw. in einem eigenen Ordner (Verzeichnis) gespeichert. Alle diese Ordner wiederum werden in einen übergelagerten Ordner eingefügt, den Ordner "papers". Wo dieser Ordner namens "papers" sich befindet (auch z.B. auf einem USB-Stick), kann man selber bestimmen, umtaufen kann man ihn auch. Grundsätzlich werden die Dokumente nicht sortiert (nur mit Datum), aber per Suche findet man alles sehr schnell. Die Suche sucht in den Texten der Dokumente und unter den zusätzlich eingegebenen Wörtern und reiht alle so gefundenen Dokumente in der linken Spalte auf. Jedes Dokument kann man exportieren, wenn man das nötig findet, die OCR-Schicht bleibt erhalten. Ich habe hier nicht alles aufgeführt, was das Programm kann, aber es bleiben kaum Wünsche unerfüllt. Und eine gut verständliche, ausführliche deutsche Hilfe gehört zum Programm dazu.
von markusbuech » Mi 25. Jan 2023, 10:17
wird dann eine Gliederung angelegt, aber für alle Seiten, egal ob auch nur eine einzelnen Link einfüge. Oder ich mache da was falsch.@LinuxBiber - Das scheint soweit mit dem Programm zu funktionieren. Bei einer Testdatei konnte ich zwei Verlinkungen bzw. Bookmarks wie es da ja heisst erstellen und seperat aufrufen. Ich werde mal ein paar grössere Dateien noch testen.@Rocki - Ich kenne Paperwork bzw. habe es versucht, aber bei meinem Rechner stürzt das Programm immer mit der Zeit ab, egal ob aus den Manjaroquellen oder per Flatpak. Auch konnte ich eine geöffnete Datei nicht schliessen. Wenn aber für jedes Dokument ein eigenes Verzeichnis erstellt wird, wäre das auch nichts für mich, da ich ziemlich viele PDF-Dokumente habe. Eigentlich bräuchte ich sowas wie eine Dokumenten-Mangament-Software, aber sowas habe ich unter Linux noch nicht gefunden.Ich Danke euch vieren für eure Unterstützung. Ich werde JPdfBookmarks ein wenig mehr testen und dann nochmal berichten.
von Rocki » Mi 25. Jan 2023, 11:33
Die vielen Ordner in Paperwork sind kein Problem. Aber wenn es andere Schwierigkeiten gibt, dann ist eine andere Lösung vielleicht besser.
Such doch mal hier:
https://alternativeto.net/software/pdf-search/
oder hier:
https://wiki.archlinux.org/title/List_of_applications
oder hier:
https://rainerstoll.at/links/buerotools ... sprozesse/
oder hier:
https://www.ubit-stmk.at/ubit-bildungsp ... en_source/
Viel Glück!
von zebolon » Mi 25. Jan 2023, 15:29
Zu den genannten Zweck eignet sich z. B. ZIM sehr gut. Hier erstellt man sich eine Gliederung nach eigenen Vorstellungen.Zu den einzelnen PDF-Dateien (oder fast jeden anderen Dateityp) kann eine Verknüpfung erstellt und per Mausklick im Standard-Programm geöffnet werden. Ergänzende Notizen oder Screenshots zu den jeweilgen Dokumenten sind ebenso möglich.
Ein weiterer Vorteil - ZIM arbeitet ohne Datenbanken.
von LinuxBiber » Do 26. Jan 2023, 21:44
JPdfBookmarks - Gliederung in PDF nachträglich setzen
von markusbuech » Di 7. Feb 2023, 18:17
@Rocki Danke für die Links. Auf der archlinux-Seite hatte ich das Programm "Bookworm" gefunden, da dort steht, man könne damit PDF und so verwalten. Aber warum auch immer zerschiesst es mir da das Original-PDF-Layout. Mit "Calibre" werd ich nicht zurecht war und "Gnome Books" hat leider keine PDF-Unterstützung. Ich werde mal weiter suchen.
@zebolon Ich habe den Begriff "Dokumenten-Managment-Software" wohl etwas falsch gewählt, obwohl es schon in die Richtung gehen soll. Ich suche ein Programm, womit ich meine Dokumente (PDF's) verwalten kann. Ich möchte z.B. Themen-Sammlungen erstellen und dort dann die PDFs zuweisen. Manche Datei passt aber auch zu zwei oder mehrern Themen, möchte aber jetzt keine unnötige Kopien im Dateisystem haben. Vor zwanzig Jahren in meiner damaligen noch-Windows-Ära hatte ich mal iTunes für meine MP3-Dateien. Es las den Musikordner ein, ich konnte sowhl durch die Ordnerstruktur als auch durch eigene Sammlungen browsen. Das tolle war, es merkte sich, wenn ich wo mal unterbrochen bzw. aufgehört habe (Hörbuch). Soetwas wünsche ich mir analgo für andere Dateitypen wie Videos, Musik, Bilder, Dokumente, ect. Bei ePub-Dateien benutze ich z.B. "Foliate". Das merkt sich zu jeder Datei wie weit ich gelesen haben. Eigentlich wollte ich sowas in der Art mal mit Nextcloud machen, aber Nextcloud ist doch irgendwie komplizierter als ich dachte und finde da auch nicht so die Infos zu.
Kann man bei Zim bei einer Verknüpfung auf einer PDF-Datei auf eine bestimmte Seite in dieser Datei verweisen? Also z.B. bei einer Zeitschrift auf einen bestimmten Artikel?
@LinuxBiber Das Programm funktioniert bei mir ganz gut. Wäre ich des Englischen mächtig, würde ich bei den "PDF Arranger" Leuten mal anfragen, ob sowas nicht bei denen ein Feature für eine zukünftige Version sein könnte.
von Alexs » Di 7. Feb 2023, 20:40
markusbuech hat geschrieben: Di 7. Feb 2023, 18:17 (…) Ich suche ein Programm, womit ich meine Dokumente (PDF's) verwalten kann. Ich möchte z.B. Themen-Sammlungen erstellen und dort dann die PDFs zuweisen. Manche Datei passt aber auch zu zwei oder mehrern Themen, möchte aber jetzt keine unnötige Kopien im Dateisystem haben.
Versuche dich näher mit Calibre zu befassen, die Software ist ja dazu gedacht eBook-Dateien (aber auch andere Dateien) zu verwalten und mit Hilfe den sogenannten Schlagwörtern (tags) – bei die wären das Themen – kann man diese sortieren, oder besser noch, man lässt die Dateien in sogenannten Virtuellen Bibliotheken anzeigen.
Wenn man ein PDF in Calibre hinzufügt, dann existiert davon nur eine Kopie im Calibre-Ordner (Calibre-Bibliothek), eine virtuellen Bibliothek zeigt dieses dann zusätzlich anhand des gewünschten Suchmusters zB. Schlagwörtern an.
Somit fügst du zuerst ein PDF in Calibre hinzu, danach unter Metadaten kommen die gewünschten Schlagwörtern (tags) – bei mehrere durch ein Komma getrennt – in das betreffende Feld hinein.
Bei einer Rezept-Bibliothek für das gschmackige und einfache Gericht Krautfleckerl, kann man folgende Schlagwörter verwenden:
Österreich, Hauptspeise, Nudeln, Kraut, Vegan
Damit alleine kann man schon nur mit dem Krautfleckerl-Rezept 5 virtuelle Bibliotheken anzeigen lassen und nun nimm 50 verschiedene Rezepte dazu.
Der Nachteil ist halt, dass innerhalb der Calibre-Bibliothek keine richtige Ordnerstruktur existiert, aber seit ich meine eBooks ausschließlich mit Calibre verwalte, stört mich das nichts im geringsten.
Ich habe übrigens dazu einen Thread geschrieben:
Calibre und weitere Verwendungsmöglichkeiten
Und man kann mit den mitinstallierten eBook-Viewer auch PDF lesen.
Ansonsten gibt es dazu das Handbuch zum nachlesen auf Deutsch:
https://manual.calibre-ebook.com/de/vir ... aries.html
https://manual.calibre-ebook.com/de/viewer.html
von robertgoedl » Do 9. Feb 2023, 17:49
Ich habe jetzt nicht gelesen, um welche Desktop-Umgebung es jetzt geht - aber versuche einmal die Software Basket. Einfach mal reinklicken, Dateien rein verschieben, rechts klicken - verknüpfen - da bieten sich unendlich viele Möglichkeiten.
Habe gestern gerade einen Beitrag von 2017 über Paperwork angesehen und finde vor allem den Schluss (Seite 3) interessant: Titel Paperwork-Alternativen. Da wird Calibre auch lobend erwähnt:
"Für die Aufnahme von Text-PDF-Dokumenten in eine Datenbank bedarf es eigentlich fast keiner Vorarbeiten: Programme wie Calibre [10] machen das ohne Probleme, und zwar oft fehlerfrei. Obwohl eigentlich zum Verwalten von E-Books entwickelt, nimmt das Programm Text-, HTML-, ODT- sowie PDF-Dokumente auf und zeigt diese an."
Quelle: https://www.linux-community.de/ausgaben ... -papier/3/