PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : HTML Mails via procmail nach txt konvertieren



TheDodger
01.07.02, 13:11
Gibt es eine Möglichkeit, bei eingehenden Emails, die als HTML verfasst wurden stumpf den HTML Part zu entfernen?
Mittels procmail müsste das doch problemlos gehen, oder?

taylor
01.07.02, 13:21
Hi!

Habs selbst nicht gemacht, aber es gibt ja ein html2ascii oder html2txt Programm, da könntest Du ja einfach "reinpipen"

Ungefähr (!) so:

:0
* ^Content-Type: text/html
| html2txt irgendwelcheoptionen
inbox

TheDodger
02.07.02, 07:29
Danke.
Mein Eintrag sieht jetzt so aus:



# =====================================
# HTML2txt
# -------------------------------------

:0 BfbW
* ^(<html>|<!doctype html)
| $HTML2TXT -style pretty -nobs | $FORMAIL -f -A "X-Converted-To-Plain-Text: by html2txt"

Allerdings habe ich dann in der Mail nicht's lesbares drinstehen ...
Erst, wenn ich mir den Text als Source anschaue, bekomme ich den -lesbaren- Inhalt zu sehen.

taylor
02.07.02, 10:21
Hi!

Sieht ja klasse aus soweit. Ich hab das mal nachvollzogen, und mir scheint, als würde html2text sich vom nicht-html-teil der Nachricht verrückt machen lassen. Also z.B. die Header Zeilen, oder bei Multipart Messages der Text-Teil.

Man müsste html2text *nur* den Teil unterhalb von
Content-Type: text/html; charset="iso-8859-1"
Content-Transfer-Encoding: quoted-printable

übegeben. Ich schätze, formail kann das, aber *das* hab ich selbst noch nie angefasst, da kann ich leider nicht helfen.

Grüsse,
Taylor

TheDodger
02.07.02, 12:02
Danke wegen dem Klasse :)

also laut man page bräuchte ich nur :0 bf angeben ... und dann auf content-type parsen, aber dann läuft er nicht in das Rezept rein.

wenn ich das hier nehme :


:0 Bbf
* ^Content-type: text/html
| cat > /tmp/m$$.html ; lynx -dump /tmp/m$$.html ; rm /tmp/m$$.html


schrottet er mir auch die komplette mail :(