Wo liegt hier der Fehler?
Du ersetzt alle " durch einen Zeilenvorschub bzw. neue Zeile
D.h. aus
Code:
<a href="http://meine.seite.de">Überschrift</a>
wird
das jagst du dann zeilenweise durch grep
Das ^ bedeutet Zeilenanfang. Daher wird auch nur die URL gefunden und sonst nichts, in der Zeile steht ja auch nicht mehr.
Wenn Du nun aber nach
suchst, findest Du gar nichts, denn der Suchstring steht so nicht am Zeilenanfang und außerdem ist in dieser Zeile dann auch nicht mehr zu finden.
Mit etwas Glück könnte es so funktionieren (ungetestet!)
Code:
sed 's|"|\n|g' 100*.html | sed 's|</a>||g' | grep "^>" | sed 's|>||g'
Das erste sed kennst Du bereits, das Zweite entfernt </a> das grep holt Dir die Zeile mit dem > am Zeilenanfang und das letzte sed nimmt das > auch noch weg. Übrig sollte nur die Überschrift bleiben.
Keine Gewähr
Gruß
Tom
Lesezeichen