Hallo,
ich bin schon einmal daran hängen geblieben.
Und zwar nutze ich HTDIG zur Indexierung.
Dabei wird bis auf rtf alles ordentlich dargestellt.
PDF, doc und htm sehen aus wie sie sollen.
Alle Inhalte der rtf Files sehen auf der Suchseite dann so aus:
{\rtf1\ansi\ansicpg1252\uc1 \deff0\deflang1031\deflangfe1031{\fonttbl{\f0\from an\fcharset0\fprq2{\*\panose 02020603050405020304}Times New Roman;}{\f1\fswiss\fcharset0\fprq2{\*\panose 020b0604020202020204}Arial;} {\f23\froman\fcharset128\fprq1{\*\panose 02020609040205080304}MS Mincho{\*\falt MS ??};} ...

Also werden rtf Files statt Konvertiert zu werden einfach im KLartext inclusive der Steuerzeichen ausgelesen. Hat wer ne idee was da noch zu machen ist?