Über google habe ich zwar einiges gefunden um mehrfache/doppelte Dateien zu finden (z. B. http://www.pcgo.de/praxis/tipps/cm/t...hp?nr=2&id=443 ), aber das ist ja nur zur info; ich brauche (auf einer Partition) mehrfachen Dateien (gleiche Größe + md5sum) durch eine "reale" Datei und mehrere hard links ersetzt (wenn der Binärvergleich z. B. mit diff ergibt, dass die Dateien wirklich gleich sind).
Gibt's dafür schon ein Programm oder geniale Skripte?
Im Prinzip ist's ja nicht schwer: man erzeugt zuerst eine Liste von Strukturen mit Dateinamen, md5sum u. Größe, sortiert mit qsort nach md5sum + Größe und arbeitet dann die Blöcke mit gleicher md5sum + Größe ab (u. logt die Änderungen optional ).
Lesezeichen