Anzeige:
Seite 1 von 2 12 LetzteLetzte
Ergebnis 1 bis 15 von 19

Thema: Spammer nerven, indem man ihre Harvester quält..

  1. #1
    Registrierter Benutzer
    Registriert seit
    Jun 2003
    Ort
    Bochum
    Beiträge
    56

    Wink Spammer nerven, indem man ihre Harvester quält..

    Hi,

    wer Webmaster ist, und Lust hat, den Spammern ihre tägliche Arbeit etwas schwerer zu machen und sie zurückzuverfolgen (wenn sie dumm genug sind ), sollte sich folgendes mal anschauen:

    http://oditech.net/anti-spam/

    Kennt ihr sicher schon, weils auf heise.de war, aber da eine Forumssuche nach "Harvester" und "Rehbein" nicht grad viel brachte, dachte ich mir, frisch ich das Thema mal auf.


    Gruss,
    dun
    $ whatis real-life
    real-life: nothing appropriate

  2. #2
    Lernend...
    Registriert seit
    Dec 2002
    Ort
    Oldenburg
    Beiträge
    87
    Ich bin ja mal echt gespannt ob man sich jemals effektiv gegen Spam wehren
    kann, bzw. es einen sinnvollen Schutz geben wird...

    Würde es etwas bringen wenn man sich zusammentun würde um Harvester zu jagen und protokollieren??? So eine Art Sammelklage...

  3. #3
    Error kein Titel Avatar von Spike05
    Registriert seit
    Apr 2002
    Ort
    Neu-Ulm
    Beiträge
    4.345
    Original geschrieben von SCH4K4L
    Ich bin ja mal echt gespannt ob man sich jemals effektiv gegen Spam wehren
    kann, bzw. es einen sinnvollen Schutz geben wird...

    Klar ist kein Thema!

    Hab mir mal einen Emailfilter eingerichtet der nur Emails von erlaubten Adressen annimmt! Schon bekommt man keine einzige Spammail mehr! Der Nachteil darin ist, das dir auch sonst keiner eine Email schicken kann!

    cu

    Jochen

  4. #4
    Lernend...
    Registriert seit
    Dec 2002
    Ort
    Oldenburg
    Beiträge
    87
    Genau, das ist das Problem!!! Wen man nicht "freischaltet" sieht man auch nicht...

    Für mic ist das leider etwas "unpraktikabel" => Ebay und würde eigentlich lieber etwas direkt gegen die Spammer unternehmen...

    Einzige Lösung wäre eine Blacklist für enthaltene Worte zu benutzen... - Dazu sollte ich mich aber ersteinmal für eine Distri entgültig entscheiden und auch behalten...

    Im Moment gehts noch rauf und runter (seit ca. 3 Jahren) :-) und kann mích immer noch nicht festlegen! HILFEEE... Mittlerweile kenne ich: Suse, Debian, Mandrake und Redhat (Reihenfolge vom Start bis Heute)...

  5. #5
    Registrierter Benutzer
    Registriert seit
    Aug 2001
    Beiträge
    350
    http://oditech.net/cgi-bin/members.cgi

    Das Teil ist genial... Wenn jeder Webmaster dieses Skript einsetzt oder verlinkt, sind die harvester gleich nutzlos. Ich kann mir nicht vorstellen, dass die harvester die Verarsche so schnell erkennen und aus der Schleife rauskommen

    MfG Xare

    edit: Könnten wir nicht auf der Startseite von linuxforen.de einen klitzekleinen unsichtbaren solchen Link anbringen? Das würde sicher ne Menge harvester ins Leere laufen lassen...
    Geändert von xare (17.07.03 um 15:40 Uhr)

  6. #6
    Premium Mitglied
    Registriert seit
    Jun 2002
    Beiträge
    2.483
    So ein Skript schafft aber neue Probleme:
    1. Suchmaschinen sind davon betroffen
    2. der eigene Traffik steigt
    3. IMO ist es schlecht, unschuldige dritte mit SPAM zu versorgen, nur weil existente bzw. mögliche Domainnamen verwendet werden.
    Zweiblum versuchte es ihm zu erklären
    Rincewind versuchte es zu verstehen

    Wie man Fragen richtig stellt

  7. #7
    Registrierter Benutzer
    Registriert seit
    Aug 2001
    Beiträge
    350
    zu 1.: Da gibts doch so files für die Suchmaschinen, wo man NO_FOLLOW reinschreibt, oder irre ich mich da? Wenn die Suchmaschine darauf nicht hören will, selber schuld, wenn der harvester das missachtet, Zweck erfüllt.

    zu 2.: wenn jemand ein Forum hat, werden auch ständig Seiten generiert, ich glaube nicht, dass die Rechenzeit und der Traffic da so sehr ins Gewicht fällt. Außerdem hat das Skript eine Variable, in der man die zu wartende Sekundenzahl schreibt, bevor eine neue Seite erzeugt werden soll.

    zu 3.: die Domainnamen kann man schon so wählen, dass kein unschuldiger Spam kriegt.

    MfG Xare

  8. #8
    Registrierter Benutzer
    Registriert seit
    Jun 2003
    Ort
    Bochum
    Beiträge
    56
    zu 3.: die Domainnamen kann man schon so wählen, dass kein unschuldiger Spam kriegt.
    Jau, ich hab in der Standardeinstellung von WPoison noch keine funktionierende Domain entdeckt, auch wenn manche ziemlich echt aussehen.
    $ whatis real-life
    real-life: nothing appropriate

  9. #9
    Lernend...
    Registriert seit
    Dec 2002
    Ort
    Oldenburg
    Beiträge
    87
    Hey, das ist ja mal eine super Idee... Werde mir das ganze mal etwas genauer anschauen wenn ich am Wochenende Zeit habe!

    Klingt aber vielversprechend!!!

  10. #10
    Registrierter Benutzer
    Registriert seit
    Sep 2002
    Beiträge
    610
    Original geschrieben von xare
    zu 1.: Da gibts doch so files für die Suchmaschinen, wo man NO_FOLLOW reinschreibt, oder irre ich mich da? Wenn die Suchmaschine darauf nicht hören will, selber schuld, wenn der harvester das missachtet, Zweck erfüllt.
    Seite aufgerufen (Wpoison), Quelltext angesehen und das gefunden:

    Code:
    <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
    Eigentlich sollten dann auf diesen Seiten die Suchmaschinen nix interessantes finden (außer ein paar Müll-Links und Müll-Adressen). Die Harverster werden diesen Text aber sehr wahrschenilich ignorieren - denn sonst kämen sie ja nicht an eventuell lukrative Unterseiten ran (die im Suchmaschinen-Cache nix zu suchen haben - Kontakt-Emails z.B.)

    Also mir gefällt die Idee

    ciao

    Michael
    Im Internet verschwinden immer mehr Rentner spurlos weil sie Alt und Entfernen gleichzeitig drücken.

  11. #11
    Premium Mitglied
    Registriert seit
    Jun 2002
    Beiträge
    2.483
    1. suchmaschinen müssen sich nicht daran halten, die meisten tun es zwar zwingend ist es jedoch nicht.
    2. Rechnenzeit und Traffik wird dann ins Gewicht fallen, wenn ein besonders dummer Sammelbot vorbeikommt. Die Rechnung wollte ich dann nicht bezahlen müssen.
    3. (das ist übrigens mein Lieblingspunkt) setzt euch auf die gleiche soziale Schwelle wie die Spammer. Ihr verwendet adressen, bei denen nicht sichergestellt werden kann das es diese weder gibt noch jemals geben wird. Es gibt 2 Ausnahmen: example.com und die eigene Domain, aber die verwendet ihr ja anscheinend nicht. Vielleicht solltet ihr euch doch mal die Seite von Daniel Rehbein durchlesen, wenn ihr Ihn schon nennt. Im Gegensatz zu euch macht er es richtig und verpasst nicht noch einem unschuldigen dritten das Problem.
    Zweiblum versuchte es ihm zu erklären
    Rincewind versuchte es zu verstehen

    Wie man Fragen richtig stellt

  12. #12
    Error kein Titel Avatar von Spike05
    Registriert seit
    Apr 2002
    Ort
    Neu-Ulm
    Beiträge
    4.345
    Original geschrieben von Jinto
    Vielleicht solltet ihr euch doch mal die Seite von Daniel Rehbein durchlesen, wenn ihr Ihn schon nennt. Im Gegensatz zu euch macht er es richtig und verpasst nicht noch einem unschuldigen dritten das Problem.
    Außerdem weißt er auch auf diejenigen in de.admin.net-abuse.mail hin, die seine Inhalte von seiner Homepage klauen!

    Das was auf der Seite steht die hier im Ursprungspost zu lesen ist, kann man auf Daniel Rehbein's Seite eigentlich auch nachlesen!

    cu

    Jochen

  13. #13
    Registrierter Benutzer
    Registriert seit
    Jun 2003
    Ort
    Bochum
    Beiträge
    56
    Hi,

    3. (das ist übrigens mein Lieblingspunkt) setzt euch auf die gleiche soziale Schwelle wie die Spammer. Ihr verwendet adressen, bei denen nicht sichergestellt werden kann das es diese weder gibt noch jemals geben wird.
    Naja. Dieses Argument (das nicht schlecht ist) kann man aber von zwei Seiten sehen.

    1. sind die Domains, die Wpoison verwendet recht gut 'ge-random-t'. Schwer, eine zu finden, die es auch wirklich gibt.

    2. zu "jemals geben wird": nunja, die Spammer/Harvester könnten ja auch genauso gut selbst zufällige Domains erstellen, anstatt den "Umweg" über Wpoison zu gehen.. Nur tun sie es nicht, weil wie gesagt der grösste Teil der Domains ungültig ist und somit ihre Mail-Datenbank verwässert, was zur Folge hat, dass sie sie nicht mehr so gewinnbringend verkaufen können. Sie müssten dann wohl eh mit nem Domainchecker drübergehen und die ungültigen rausfiltern. Wpoison verlängert diesen Prozess ein wenig

    Ich finde die Idee eigentlich gut.

    Das mit der robots.txt:
    nun, dafür ist sie doch da. Um Suchmaschinen/Bots anzuweisen, wie sie bei der Datensuche vorzugehen haben. Wer sich nicht daran hält, ist selbst schuld.

    Das Trafficproblem ist wirklich eins, aber wenn man die Wartezeit im Script hoch einstellt, dürfte es eigentlich nicht allzusehr ins Gewicht fallen.


    Das was auf der Seite steht die hier im Ursprungspost zu lesen ist, kann man auf Daniel Rehbein's Seite eigentlich auch nachlesen!
    Naja, auf der Seite sind dazu ganz oben 4 Links, von denen einer auf Daniel's Seite verweist.
    Das PHP-Script ist von einem heise.de-User, und auch als Quelle mit angegeben..

    Gruss,
    dun
    $ whatis real-life
    real-life: nothing appropriate

  14. #14
    Premium Mitglied
    Registriert seit
    Jun 2002
    Beiträge
    2.483
    Original geschrieben von dun
    1. sind die Domains, die Wpoison verwendet recht gut 'ge-random-t'. Schwer, eine zu finden, die es auch wirklich gibt.
    Wenn es auch nur eine existente erzeugt find ich das schon katastrophal.
    2. zu "jemals geben wird": nunja, die Spammer/Harvester könnten ja auch genauso gut selbst zufällige Domains erstellen, anstatt den "Umweg" über Wpoison zu gehen.
    Diese Programme gibt es bereits.
    Nur tun sie es nicht, weil wie gesagt der grösste Teil der Domains ungültig ist und somit ihre Mail-Datenbank verwässert, was zur Folge hat, dass sie sie nicht mehr so gewinnbringend verkaufen können. Sie müssten dann wohl eh mit nem Domainchecker drübergehen und die ungültigen rausfiltern. Wpoison verlängert diesen Prozess ein wenig
    Nicht so stark wie du vielleicht vermuten würdest, denn auch Harvester könnten ungültige Domänen filtern anhand der tld'sfiltern. Derzeit gibt es ja noch nicht so viele tld's.

    Was zur Folge hat, dass wenn man gute(?) zufällig generierte Domänen erzeugen will, gültige tld's verwenden müsste. Das wiederum führt aber dazu das die Wahrscheinlichkeit existierende/zukünftig gültige Domänen zu verwenden steigt.

    Das mit der robots.txt:
    nun, dafür ist sie doch da. Um Suchmaschinen/Bots anzuweisen, wie sie bei der Datensuche vorzugehen haben. Wer sich nicht daran hält, ist selbst schuld.
    Wie gesagt, es gibt welche die ignorieren es absichtlich, manche unabsichtlich (auch Google hatte schon Fehler in seinen Robots). Wobei Suchmschinen dynamische Webseiten oft nicht bzw. nicht tief indizieren.
    Das Trafficproblem ist wirklich eins, aber wenn man die Wartezeit im Script hoch einstellt, dürfte es eigentlich nicht allzusehr ins Gewicht fallen.
    Das Traffik Problem stellt für mich keins dar, da es nur denjenigen betrifft der solch ein Script einsetzt => selbst schuld
    Zweiblum versuchte es ihm zu erklären
    Rincewind versuchte es zu verstehen

    Wie man Fragen richtig stellt

  15. #15
    Error kein Titel Avatar von Spike05
    Registriert seit
    Apr 2002
    Ort
    Neu-Ulm
    Beiträge
    4.345
    Haben die Harvester eigentlich eine bestimmte Kennung mit der man sie identifizieren kann?

    cu

    Jochen

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •