Anzeige:
Ergebnis 1 bis 7 von 7

Thema: Formulardaten aus .pdf in Textform extrahieren

Hybrid-Darstellung

Vorheriger Beitrag Vorheriger Beitrag   Nächster Beitrag Nächster Beitrag
  1. #1
    Newbie and practicing Avatar von Newbie314
    Registriert seit
    Mar 2007
    Beiträge
    7.639

    Formulardaten aus .pdf in Textform extrahieren

    Bin überraschenderweise auf folgendes Problem gestoßen- hätte nie gedacht dass ich dazu hier im Forum nachfragen müsste:

    Wer in einem Verein in dem ich aktiv bin Mitglied werden will muss den Mitgliedsantrag als .pdf herunterladen, ausfüllen und an den Vorstand schicken. Dort werden die Daten dann in Excel exportiert, dann in CSV und dann in die Mitgliederdatenbank eingepflegt.

    Umständlich. Nun wurde ich gebeten mir das mal anzusehen.

    Das .pdf Formular wurde 2013 in Word mit Acrobat Distiller erstellt.

    Problem 1: wenn ich es im "Dokumentenbetrachter" ausfülle und abspeichere ist es nach erneutem Öffnen leer.
    Wenn ich es in Okular ausfülle und abspeichere ist es bei erneutem Öffnen mit Okular ausgefüllt, bei Öffnen mit "Dokumentbetrachter", "Libre Office Draw" oder "Gimp" oder der "Druckvorschau" leer.

    Entsprechend liefert mir der Befehl mit dem ich die Formulareinträge auslesen will
    Code:
    pdftk input.pdf generate_fdf output output.txt
    nur eine Textdatei mit den Feldnamen aber ohne die Inhalte.

    Wo liegt mein Denkfehler ? Muss das Formular unter Adobe ausgefüllt sein damit pdftk damit klarkommt ? Ist Okular an der Stelle nicht normgerecht ? Habe ich die Funktion von pdftk an der Stelle falsch verstanden ?

    Ich hoffe jemand hier hat sich schonmal mit diesem Thema befasst....

    Wo
    Bei Konsolenausgaben / Fehlermeldungen bitte immer Code Tags verwenden: [code] -Text- [/code]
    "Überzeugungen sind gefährlichere Feinde der Wahrheit als Lügen" (H. Lesch)

  2. #2
    Registrierter Benutzer
    Registriert seit
    Dec 2003
    Ort
    Dettenhausen
    Beiträge
    22.054
    befasst - ja. Vor langer Zeit.

    Conclusio war damals: PDF-Formulare sind außerhalb der Adobe-Welt nicht sicher verarbeitbar.

    (schön ist aber schon mal, daß es inzwischen Tools jenseits Adobe gibt, mit denen man sie ausfüllen kann - daß ide Daten dann evtl. jenseits des eigenen Clients nicht auslesbar sind ist ein anderes Problem)

    Die Option auf ein Online-Formular oder ODF zu gehen gibt's vermutlich nicht?


    edit und google meint, evtl. lohnt sich ein Blick auf http://stackoverflow.com/questions/2...-automatically - https://pdfbox.apache.org/
    Geändert von marce (09.03.17 um 13:43 Uhr)
    Ich bin root - ich darf das.

  3. #3
    Newbie and practicing Avatar von Newbie314
    Registriert seit
    Mar 2007
    Beiträge
    7.639
    OK, muss da noch etwas dazulernen, bis jetzt war es ein Fehler in der Art wie ich Okular verwende.

    Als Standard lässt Okular das .pdf unverändert und speichert alle Notierungen und Änderungen in einer .xml Datei in einem .kde Ordner. Daher werden die Änderungen auch in anderen Programmen nicht angezeigt. Nur wenn man "Datei speichern unter" wählt werden die Änderungen wirklich ins .pdf geschrieben.

    Wenn ich das tue zieht pdftk diese Felder auch raus....

    Quelle: https://wiki.ubuntuusers.de/Okular/

    Werde doch mal mit pdf weiterexperimentieren.

    Edit: du meinst das hier:
    Die Option auf ein Online-Formular oder ODF zu gehen gibt's vermutlich nicht?
    Habe ich gelesen. Werde mir parallel zu der .pdf Version (mit Foxit, Okular und Adobe Reader zu testen) mal ansehen was Wordpress so bietet. Dort dürfte allerdings der Aufwand fürs Webteam arg steigen.

    Rechtlich (gerade mit der Einzugsermächtigung für die Beiträge) wird der Vorstand einen der Juristen fragen die im Verein aktiv sind- ich habe das nur angesprochen und erwarte da eine Vorgabe von Leuten die sich auskennen.
    Geändert von Newbie314 (09.03.17 um 13:58 Uhr)
    Bei Konsolenausgaben / Fehlermeldungen bitte immer Code Tags verwenden: [code] -Text- [/code]
    "Überzeugungen sind gefährlichere Feinde der Wahrheit als Lügen" (H. Lesch)

  4. #4
    Newbie and practicing Avatar von Newbie314
    Registriert seit
    Mar 2007
    Beiträge
    7.639
    Online Formular wurde vom Vereinsvorstand sogar explizit angesprochen, da ich aber kein Web-Profi bin traue ich mir nicht zu das wirklich so sicher zu installieren dass es nicht knackbar ist (die diversen "injection" Techniken).

    Außerdem wird der Server nicht wirklich regelmäßig kontrolliert (Webpaket bei Strato, von uns guckt keiner regelmäßig in die Logs, daher habe ich Bedenken mit "aktiven" Inhalten).

    .pdf klang verlockend da es jeder kennt und wir bereits das Formular haben- wenn die Daten aber nicht auslesbar sind nützt das nichts.

    Gibt es fertige "Webformular Toolkits" bei denen man nur darauf achten muss dass man die Sicherheitsupdates einspielt (etwa so wie owncloud / Wordpress wo man auch kein Profi sein muss sondern nur regelmäßig aktualisieren...) ?
    Bei Konsolenausgaben / Fehlermeldungen bitte immer Code Tags verwenden: [code] -Text- [/code]
    "Überzeugungen sind gefährlichere Feinde der Wahrheit als Lügen" (H. Lesch)

  5. #5
    Registrierter Benutzer
    Registriert seit
    Dec 2003
    Ort
    Dettenhausen
    Beiträge
    22.054
    mein edit von oben hast Du gesehen?

    Ansonsten - gerade für Wordpress gibt's div. passende Formular-Baukästen - je nach Wunsch kommt da dann am Ende eine Datenbanktabelle, Email, ... raus.
    Ich frage mich nur geradem, wie es denn da rechtlich aussieht - Vereins-Mitglieds-Dinge sind ja meist noch irgendwie Papier-verhaftet und reine Online-Varianten ggf. mit Nachfolge-Aufwand versehen...
    Ich bin root - ich darf das.

  6. #6
    Registrierter Benutzer
    Registriert seit
    Dec 2003
    Ort
    Dettenhausen
    Beiträge
    22.054
    Jein - eher den Link zu Stackoverflow bzw. Apache - aber wenn's jetzt auch schon geht (das übliche "kaum macht man es richtig, funktioniert es auch") ist das ja "erledigt".
    Ich bin root - ich darf das.

  7. #7
    Newbie and practicing Avatar von Newbie314
    Registriert seit
    Mar 2007
    Beiträge
    7.639
    (rotwerd) hatte ich nicht gesehen, dazu hätte ich "reload" drücken müssen.... jedenfalls enthält der Thread jetzt jede Menge Hinweise falls jemand Anderer ein ähnliches Problem lösen will.
    Bei Konsolenausgaben / Fehlermeldungen bitte immer Code Tags verwenden: [code] -Text- [/code]
    "Überzeugungen sind gefährlichere Feinde der Wahrheit als Lügen" (H. Lesch)

Ähnliche Themen

  1. Okular: Gespeicherte Formulardaten löschen?
    Von gadget im Forum Anwendungen Allgemein, Software
    Antworten: 2
    Letzter Beitrag: 05.03.15, 13:32
  2. Mit Curl via ssl Formulardaten übertragen..
    Von itconsul im Forum Linux als Server
    Antworten: 2
    Letzter Beitrag: 26.07.07, 18:06
  3. [Frage] Firefox + Formulardaten
    Von |sXe| im Forum Anwendungen Allgemein, Software
    Antworten: 4
    Letzter Beitrag: 08.02.05, 15:42
  4. PHP Formulardaten an zwei Ziele
    Von sage im Forum Linux Allgemein
    Antworten: 7
    Letzter Beitrag: 10.11.03, 01:20
  5. Apache PHP-Formulardaten per POST kommen nicht an
    Von Benngun im Forum Linux als Server
    Antworten: 9
    Letzter Beitrag: 07.08.03, 20:01

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •