Flightbase
30.06.10, 19:10
Moin moin,
ich habe aktuell das Problem, dass ich mit einem Projekt über 3 rootserver gewandert bin - und jetzt von 3 rootservern apache2 logfiles habe. natürlich jeweils mit vhost logs, damit das nicht zu einfach wird. erschwerend kommt hinzu, dass die verschiedenen logfiles unterschiedlich im logrotate waren - und somit stimmt vhost1-access.log.4.gz zeitlich nicht mit vhost2-access.log.4gz überein ;(
ich könnte mir schon den tag und die uhrzeit des jeweiligen umzugs raussuchen - es bleibt aber das problem, dass ich alle vhost datein erstmal mergen muß.
wenn ich mir da jetzt das ausmaß ansehe:
server 1:
root@xxxxx:~/42/export42/logs# du -sh
18G .
server 2:
root@xxxxx:~/120/export120/logs# du -sh
38G .
server 3:
root@xxxxx:~/88/logs# du -sh
13G .
in den ordnern liegen nur die access datein als .gz drin - ich habe mal wahllos eine entpackt:
time unp www-access.log.13.gz
real 1m20.086s
na ja - eine minute 20 für das entpacken.... aber jetzt kommts:
ls -hal www-access.log.13*
-rw-r--r-- 1 root root 6.9G 2010-06-30 19:59 www-access.log.13
-rw-r----- 1 root root 506M 2009-10-08 07:22 www-access.log.13.gz
wenn ich jetzt mal grob überschlage komme ich auf ca. 1 TB plain text an logfiles. das ganze zu sortieren dauert vermutlich tage bis wochen.
aktuell habe ich mit dem logresolvemerge.pl script angefangen, dass bei awstats dabei ist.
das ist aber extrem lahm.
hat jemand einen vorschlag, wie ich aus mehreren ordnern alle vorhandenen datein mergen kann? output sollte natürlich auch nicht eine datei sein - sondern sagen wir 5gb häppchen.
heissen dank für jeden tipp im vorraus!
greets, Nik
ich habe aktuell das Problem, dass ich mit einem Projekt über 3 rootserver gewandert bin - und jetzt von 3 rootservern apache2 logfiles habe. natürlich jeweils mit vhost logs, damit das nicht zu einfach wird. erschwerend kommt hinzu, dass die verschiedenen logfiles unterschiedlich im logrotate waren - und somit stimmt vhost1-access.log.4.gz zeitlich nicht mit vhost2-access.log.4gz überein ;(
ich könnte mir schon den tag und die uhrzeit des jeweiligen umzugs raussuchen - es bleibt aber das problem, dass ich alle vhost datein erstmal mergen muß.
wenn ich mir da jetzt das ausmaß ansehe:
server 1:
root@xxxxx:~/42/export42/logs# du -sh
18G .
server 2:
root@xxxxx:~/120/export120/logs# du -sh
38G .
server 3:
root@xxxxx:~/88/logs# du -sh
13G .
in den ordnern liegen nur die access datein als .gz drin - ich habe mal wahllos eine entpackt:
time unp www-access.log.13.gz
real 1m20.086s
na ja - eine minute 20 für das entpacken.... aber jetzt kommts:
ls -hal www-access.log.13*
-rw-r--r-- 1 root root 6.9G 2010-06-30 19:59 www-access.log.13
-rw-r----- 1 root root 506M 2009-10-08 07:22 www-access.log.13.gz
wenn ich jetzt mal grob überschlage komme ich auf ca. 1 TB plain text an logfiles. das ganze zu sortieren dauert vermutlich tage bis wochen.
aktuell habe ich mit dem logresolvemerge.pl script angefangen, dass bei awstats dabei ist.
das ist aber extrem lahm.
hat jemand einen vorschlag, wie ich aus mehreren ordnern alle vorhandenen datein mergen kann? output sollte natürlich auch nicht eine datei sein - sondern sagen wir 5gb häppchen.
heissen dank für jeden tipp im vorraus!
greets, Nik