piccus
09.06.11, 08:01
Hallo zusammen,
ich habe ein großes PDF-Dokument. Auf jeder Seite befindet sich eine individuelle eMail-Adresse.
Der Plan ist, das Dokument in viele Einzelseiten zu zerlegen und dann mit einer Schleife nach der eMail-Adresse zu suchen und die jeweilige Datei richtig umzubenennen.
Hier ist mein bisheriges Werk:
# Zerlege großes PDF:
pdftk *.pdf burst
# Jede PDF-Datei im Ordner muss nach HTML konvertiert werden...
for i in *.pdf;
do pdftohtml $i;
# ... damit man darin nach der eMail-Adresse suchen kann:
adresse = `egrep "\w+([._-]\w)*@\w+([._-]\w)*\.\w{2,4}" $i.html`;
# Zu guter Letzt wird der Dateiname angepasst:
mv $i.pdf $adresse.pdf;
done
Das erste Problem ist die Zeile
adresse ...
Die Fehlermeldung lautet dann:
Datei pg_0001.pdf.html nicht gefunden
Das leuchtet mir ein, weil $i ja den Wert pg_0001.pdf hat und nicht pg_0001
Wie kann ich den Wert von $i so ändern, dass ich -wie in meinem Skript oben- wahlweise $i.pdf oder $i.html ansprechen kann?
Gruß
piccus
ich habe ein großes PDF-Dokument. Auf jeder Seite befindet sich eine individuelle eMail-Adresse.
Der Plan ist, das Dokument in viele Einzelseiten zu zerlegen und dann mit einer Schleife nach der eMail-Adresse zu suchen und die jeweilige Datei richtig umzubenennen.
Hier ist mein bisheriges Werk:
# Zerlege großes PDF:
pdftk *.pdf burst
# Jede PDF-Datei im Ordner muss nach HTML konvertiert werden...
for i in *.pdf;
do pdftohtml $i;
# ... damit man darin nach der eMail-Adresse suchen kann:
adresse = `egrep "\w+([._-]\w)*@\w+([._-]\w)*\.\w{2,4}" $i.html`;
# Zu guter Letzt wird der Dateiname angepasst:
mv $i.pdf $adresse.pdf;
done
Das erste Problem ist die Zeile
adresse ...
Die Fehlermeldung lautet dann:
Datei pg_0001.pdf.html nicht gefunden
Das leuchtet mir ein, weil $i ja den Wert pg_0001.pdf hat und nicht pg_0001
Wie kann ich den Wert von $i so ändern, dass ich -wie in meinem Skript oben- wahlweise $i.pdf oder $i.html ansprechen kann?
Gruß
piccus