Microsoft gaat de strijd aan met online spamlinks

Na de aanval geopend te hebben op spam die zich huisvest in e-mails, e-mailservers en voor dat doel gebouwde internetpagina's, gaat Microsoft nu zijn pijlen richten op zogenaamde commentspam. Dit type reclame viert sinds de opkomst van weblogs en de daaraan gekoppelde populariteit van het achterlaten van berichten hoogtij. Commentspam houdt in dat de reactiemogelijkheden op deze digitale dagboeken en fora geautomatiseerd volgestouwd worden met reclamelinks. Terwijl bezitters van deze systemen zich het hoofd breken over hoe zij deze aanvallen kunnen weerstaan, heeft Microsoft naar eigen zeggen een gereedschap ontwikkeld dat in ieder geval een doel van commentspam onhaalbaar maakt, namelijk opname en populariteitsvergroting van het doeldomein in zoekmachines.

Microsoft Strider Search Defender-logoDe toepassing is Strider Search Defender gedoopt en is onder meer bedoeld om geïntegreerd te worden in het indexeringssysteem van zoekmachines. Strider werkt in drie stappen. Eerst wordt er door het onderdeel Spam Hunter een lijst opgebouwd met 'erkende' spamsites. Vervolgens wordt er via het 'link:'-commando in een zoekmachine gezocht naar websites die verwijzen naar deze spamdoelen. Als laatste worden de gewraakte links door de zogenaamde Strider URL Tracer verwijderd uit het verdere indexeringsproces. Microsoft hoopt hiermee websites die zich op notoire wijze bedienen van commentspam te demotiveren hiermee door te gaan.

Naast het verwijderen van spamlinks kan Strider Search Defender contact opnemen met de beheerder van het vervuilde domein en hem ervan op de hoogte brengen dat er ongewenste reclameverwijzingen zijn aangetroffen. Ook kunnen aanbieders van gratis websites, zoals Blogspot en MySpace, de toepassing standaard in hun software opnemen om preventief commentspam tegen te gaan. Veel populaire weblogsystemen bieden al soortgelijke oplossingen aan om het probleem tegen te gaan, zoals Wordpress en Pivot. Ook Google heeft eerder een poging gedaan iets tegen commentspam te doen, namelijk door aan te raden het 'nofollow'-attribuut mee te geven aan links in de reactiepanelen van weblogs. Hierdoor zouden zoekmachines de aanwezige informatie niet meenemen in hun indexering. Niettemin heeft deze oplossing weinig navolgers en toepassingen in zijn kielzog zien verschijnen.

Commentspam (smudge)

Door Inge Janse

15-07-2006 • 19:29

48

Reacties (48)

48
48
21
6
2
22
Wijzig sortering
dit is inderdaad erg iritante manier van spamming. yourtube staat er al vol mee. maar ik denk dat er in de praktijk niet veel zal veranderen.
Zolang er bakken met mensen zijn die een blog neerknallen, daar 3x in krassen en vervolgens jan en alleman er in laten posten zonder ooit te modereren, nee. Ditto voor gastenboeken.
Nice article! I bet you'll really enjoy my homepage, www.viagra-online.com. Go check it out!

( B-) )
toffe site. goedkopere viagra kan je niet vinden. :Y)
Tenzij je opgewonden raakt van de nieuwe Conroe's ;)
Naast het verwijderen van spamlinks kan Strider Search Defender contact opnemen met de beheerder van het vervuilde domein en hem ervan op de hoogte brengen dat er ongewenste reclameverwijzingen zijn aangetroffen.
Nu maar afwachten wanneer Femme zn mail krijgt :P
Anoniem: 156551 15 juli 2006 19:39
Ik snap niet waarom men (dergelijke sites) gewoon geen imageverificatie invoeren :? Dan zijn spambots al uitgeschakeld.
Hier zijn drie redenen voor:
- Plaatjes zijn al vrij snel leesbaar door een script
- Plaatjes die niet leesbaar voor een script zijn, zijn meestal ook niet echt leesbaar voor de gebruiker.
- Die plaatjes zijn irritant (ook door punt 2), voor een registratie is dat nog niet erg, maar voor elk berichtje is gewoon zwaar irritant.
punt 3 is te verbeteren door alleen voor het eerste bericht een image verificatie te vragen.
Anoniem: 38519 @Room4216 juli 2006 12:04
Ik laat op mijn site alleen reacties met links toe als de persoon reageert als "geregistreerd" iemand. Als je registreert krijg je zo'n image verification voorgeschoteld. Site heeft 3000+ reacties per dag en het was een echte hel om die spam-brol te overwinnen. So far lijkt deze methode toch te helpen, want ik heb al meer dan 2 maand geen enkele reclame-post gekregen *hout vasthouden*
Dat zal echter ook maar een kwestie van tijd zijn.
Bouw je gastenboek met flash, dat is simpel (je haalt ergens een template vandaan ofzo) en zoekmachines komen niet in swf bestanden.
Ook een oplossing is om alleen bijv de googlebot, firefox, ie etc clients toe te staan.
Ik heb ook nog geen spambots aangetroffen die JavaScript ondersteunen. Sinds ik een comment feature via AJAX laat lopen ben ik ineens alle spambots kwijt. Maar ook zoiets werkt ook alleen maar omdat verder bijna niemand dit nog doet. Zodra de meute hier lucht van krijgt gaan spambots natuurlijk ook javascript parsen.

zoiets als dit is simpel en effectief:
<form action="reageren_vereist_javascript.html" onSubmit="this.setAttribute('action','submitform.php')">
En nog een reden: De algoritmes om ze te herkennen worden ook steeds beter, waardoor ze op een gegeven moment geen nut meer hebben.

Edit: sh*t... Net iets te laat @mphilipp
Comment spam zal snel stoppen als iedereen eens de tijd nam om de bagger direct te wissen. Maar nee, duizenden blogs en gastboeken staan wagenwijd open voor een simpel script. Met als gevolg dat men automatisch in Google et al meer van hetzelfde zoekt, en vol probeerd te spammen.

Recent iets leuks over geschreven:
http://johnbokma.com/mexit/2006/07/13/

BlogSpot (Google) doet er (nog) niets aan, zelfs na 2 weken staat het circus nog open.
Alsof bots 'nadenken' en zien waar wel en niet wat verwijderd wordt. Nee joh, bots blijven gewoon die rommel erin pompen, of je het nu verwijdert of niet. De kans op succes is gewoon het grootst als je blijft 'flooden'.
"Alsof bots 'nadenken' en zien waar wel en niet wat verwijderd wordt. Nee joh, bots blijven gewoon die rommel erin pompen, of je het nu verwijdert of niet."

Tot iedereen het altijd verwijderd, *en* gaat klagen bij de ISP (IP address van de bot), en de spamvertized sites.
RE: JJJBokma

Ja, dat helpt enorm, echt élke Chinese, Russische, Afrikaanse en Zuid Amerikaanse ISP vindt het v-r-e-s-e-l-i-j-k dat zijn klanten zomaar spambots draaien.

Oftonnie?
"Ja, dat helpt enorm, echt élke Chinese, Russische, Afrikaanse en Zuid Amerikaanse ISP vindt het v-r-e-s-e-l-i-j-k dat zijn klanten zomaar spambots draaien."

Hoeveel abuse emails heb je al verzonden, en wat zijn jouw ervaringen? Of herhaal je maar wat dingen die iemand ooit eens uit zijn duim gezogen heeft?

De bagger die bij Google al 14+ dagen staat te redirecten doet dat vandaag nog steeds. Al diverse klachten gestuurd. Nee, Google is snel ( http://johnbokma.com/mexit/2006/07/13/ )
ik beheer een aantal website en moet dagelijk tientallen van dit soort berichten verwijderen. Daarnaast staan die berichten er 's nachts al op en worden dan geindexeerd.

Er kwamen zelfs bots die zich automatisch aanmelden met een gebruikersnaam en emailadres!

Nu heb ik de registratie nog verder dichtgetimmerd met o.a. captcha en dat blijkt de laatste weken resultaat te hebben.

Maar binnenkort zal captcha ook gewoon door OCR herkend worden.
Dan zijn spambots al uitgeschakeld.
Dat gedoe met zo'n plaatje met letters is erg vervelend. Ik moet vaak 3x kijken voordat ik goed kan zien welke letters er staan. En er zijn meer mensen die er nóg meer moeite mee hebben. En inmiddels komen de spammers steeds dichterbij manieren om OCR software te gebruiken die het truukje al kent. Het zal niet lang meer duren...
Ik gebruik Textpattern op mijn site en ik moet zeggen: de spammers komen er (nog) niet door. Mede door een 'preview'-functie, eerst een preview voor er daadwerkelijk gepost wordt. (Mijn stats laten zien dat honderden IP's uit wazige landen als Oekraïne, Burkina Faso, Vietnam, China, Korea, etc. mijn site bezoeken en vooral targetten op het 'guestbook'. Spam posten is ze nog niet gelukt.)
Mooi. Maar toch heb ik een aantal bedenkingen:

- het irritantst is dat spammers de website-eigenaar een flink deel bandbreedte kosten. Het gaat er mij niet om dat ze niets kunnen posten, het gaat er mij om dat eenvoudigweg niet eens je domein binnengeraken.
- hoe zit het met referer spam? Tegen comment spam bestaan er mooie tools, maar ik moet merken dat mijn wordpressblog toch ook onder vuurl igt van refererspammers. Vrij irritant en kostelijk.
"- het irritantst is dat spammers de website-eigenaar een flink deel bandbreedte kosten."

Die paar comment postjes per dag? Hier niet eens een fraktie van de bandbreedte (maar goed ik zit op 11,000 bezoekers/dag). Ik heb meer last van leechers.

"- hoe zit het met referer spam? Tegen comment spam bestaan er mooie tools, maar ik moet merken dat mijn wordpressblog toch ook onder vuurl igt van refererspammers."

Referers gewoon niet meer laten zien, als je doelt op: iemand "komt" van een andere site op jouw blog, en jij laat dat zien als een referer. Het nut is ook 0, wie interesseerd het nu (buiten jouzelf) dat blog xyz naar jouw blog linkt? Vaak is het een quote uit jouw entry met 2 regels tekst er bij geplakt.
ik heb voor sommige gastenboeken , een fiter ingebouwd ,
en bij het woord viagra en poker en nog een paar woorden wordt het gewoon niet geplaats.

ps : sommige ip ranges bannen helpt ook al voor 90%
Bij IP-ranges bannen sluit je onbedoeld vaak ook "gewone" gebruikers uit.
Ik ben bezig met een klein onderzoekje, en de bagger lijkt nogal vaak uit dezelfde ranges te komen. Wellicht omdat de ISP er niets aan doet (ik rapporteer elk spamgeval)? Ik zit al hard te denken om elk IP address uit zo'n range een mooie pagina voor te schotelen:

U kunt niet kijken. Voor klachten: neem contact op met uw clueless provider.
Nog mooier zou zijn als je een site kan maken met een gastenboek en als dan de bot met het verdachte IP-adres op de verzendbutton drukt deze wordt beloond met een smerig koekje van eigen deeg (denk aan een 180solutions oplossing :) of een heerlijk virus ).
Dat drukken op de verzendknop gaat buiten een browser om met een programma. Dus hoe je een virus wilt terugsturen? Het antwoord van de site wordt wellicht gewoon gedumpt.

Verder, zo'n programma draait vaak op een computer waar de eigenaar geen idee heeft dat het draait, wil je die met nog een virus opzadelen?

En tenslotte, 1 bugje in je virusplaatscode, en hop, je normale bezoek is besmet.
Erg ideaal is het niet, maar ik merkte dat gastenboeken in flash er toch minder last van hebben...
Met de oplossing die Wordpress biedt, Akismet, heb ik nu een half jaar ervaring, en het werkt simpelweg vlekkenloos. Op Akismet.com staat een tellertje met de score. Akismet heeft 110 miljoen reacties op blogs als spam herkent, en zo'n 750.000 stuks alleen al vandaag. Als Microsoft met z'n marginale marktaandeel in blogs denkt nog een kans te maken op de blog-markt gaan ze het moeilijk krijgen, gok ik.
Anoniem: 2072 @burne15 juli 2006 19:56
Mooie reclame post.
Aangezien Akismet een commerciele dienst (voor wordpress, en alleen wordpress) (maar wel "gratis" voor persoonlijk gebruik) is en geen losstaant product is er nog meer dan genoeg ruimte voor "betere" of in iedergeval andere implementaties.
Can Akismet be used for other things besides WordPress?

Absolutely. The Akismet API can be adapted for almost any application with submitted content. If you want to adapt it for a different system, please join our development community.
-edit- deze reactie moest in de root

Kan toch niet zo moeilijk zijn te beveiligen? In de pagina waar het formulier staat maak je een scriptje die een variabele opslaat in een sessie, en bij het opslaan van het formulier kijk je of deze variabele nog bestaat.
Die spullen zijn echt wel pakken slimmer dan dat hoor :)
Ik had initieel ook zo'n dingen toegevoegd aan mijn forum. Na een paar dagen werd die variabele gewoon meegenomen in het posten van een reactie. Volgens mij sturen een aantal van die bots waarschuwingen terug naar de auteur als een post mislukt en worden die dingen gewoon aangepast. In het begin was het trouwens alleen op het forum, daarna kwamen er ineens reacties bij op de verhalen, en sinds onlangs proberen ze ook via de contactformulieren.
Hier had ik ook last van op mijn weblog, zoveel last zelfs dat ik mijn comments maar uit heb gezet en een shoutbox heb geplaatst waar niet ingespamd wordt :Y)
Anoniem: 105188 15 juli 2006 23:24
Hoe zit het dan met referral sites die je doorlinken naar een andere site? Een simpele go.to (of welk andere dan ook) adres en het hele ding valt al in de soep.
Die worden dan als het goed is na een tijdje ook opgepikt door dat stap 2 gebeuren. Maar tis idd wel beetje dweilen met de kraan open, zo is de strijd tegen spam altijd. Alleen hopen nu dat het dweilen sneller gaat dan dat de kraan loopt.
Domeintjes opzich zijn voor dit soort bedrijven ook niet zo duur, kan gewoon een .com of .net zijn.

Op dit item kan niet meer gereageerd worden.