PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Bestimmten bereich runterladen wget



Danjel4u
28.02.14, 13:13
Ich kann mit wget die index.html oder bestimmte dateien von einer Seite runterladen.

Gib es auch eine Möglichkeit ein Bestimmten bereich in eine Datei zu schreiben? JPG z.b.

Auf der Seite ist eine Tabelle mit Datum ... drin diese möchte ich gern in eine Datei haben.



<h1 class="entry-title">Termine</h1></header><!-- .entry-header -->
<div class="entry-content">
<table border="0" cellpadding="0" cellspacing="0" width="600">
<colgroup>
<col width="120">
<col width="132">
<col width="139">
<col width="250">
<col width="134"> </colgroup>
<tbody>
<tr>
<td height="25" width="120">Datum</td>
<td width="132">Tag</td>
<td width="139">Uhr</td>
<td width="250">Name</td>
<td width="134">Nummer</td>
</tr>
<tr>
<td height="19">11.09.2014</td>
<td>Fr</td>
<td>2.10</td>
<td>dna</td>
<td>12266</td>
</tr>
<tr>
<td height="19"></td>
<td></td>
<td></td>
<td></td>
<td></td>
</tr>
<tr>

kann leider kein link bosten, da man sich einloggen muss. Die Index.hmtl konnte ich runterladen. Möchte gern die Tabelle in eine jpg datei.

nopes
28.02.14, 15:32
bin mir nicht sicher, ob ich dich richtig verstanden habe, aber du willst wohl auf Innereien zugreifen, das geht mit wget nicht direkt. Schau dir mal PhontomJS (http://phantomjs.org/) an, dass kann das.
Alternativ schreibe dir einen eigenen UserAgent bzw. Browser, klingt schlimmer als es ist, siehe hier (http://search.cpan.org/~gaas/libwww-perl-6.05/lib/LWP.pm).

Danjel4u
28.02.14, 19:10
danke für deine Tipps.

Mit PhontomJS bekomm ich ein Screenshot davon, aber kaum lesbar. Am besten wäre wenn nur die Tabelle ersichtlich ist.

UserAgent bzw Browser schreiben, schaut kompliziert für mich aus. Werde ich wohl so lassen müssen.

mbo
01.03.14, 08:10
Du könntest scripten und damit parsen: alles zwischen <table> und </table>