Hoofdcategorieën

Onderzoek leidt tot manier om spamfilters te omzeilen

Door Matthijs Abma, donderdag 5 februari 2004 14:36
Bron: BBC News, views: 12.210

Anti-spamonderzoeker John Graham-Cumming heeft onderzoek gedaan naar Bayesiaanse e-mailfilters en heeft een manier gevonden om deze te omzeilen, zo meldt BBC News. Bayesiaanse filters analyseren een e-mailbericht aan de hand van eerder binnengekomen mailberichten die door de gebruiker zijn gemarkeerd als spam of geen spam. Het filter maakt dus geen gebruik van standaard regels die door de spammer misbruikt kunnen worden. Na verloop van tijd wordt een persoonlijk filter opgebouwd dat voor iedere gebruiker weer anders is. Dit werkte zo goed dat spamverstuurders andere technieken zijn gaan gebruiken. Door in de spamberichten willekeurig ingewikkelde woorden te gebruiken proberen spammers deze filters te omzeilen. Gelukkig heeft dit weinig effect op een Bayesiaans filter.

Stop junk e-mail (Spam)Toch komen er af en toe spamberichten door een Bayesiaans filter heen. Graham-Cumming heeft deze berichten gebruikt voor zijn onderzoek. Hij heeft zichzelf 10.000 keer hetzelfde bericht gestuurd met daarin een verzameling willekeurige woorden. Als één van deze berichten door het spamfilter kwam, ging het een speciaal filter in dat bepaalde welke woorden het best gebruikt konden worden om door het spamfilter te komen. Tussen de gevonden woorden zaten onder andere Berkshire, Marriott, wireless, touch en comment. Als één van deze woorden voorkwam in een willekeurig e-mailbericht, gericht aan Graham-Cumming, werd het altijd doorgelaten door zijn persoonlijke Bayesiaanse spamfilter.

Het is erg moeilijk om berichten met één van deze woorden toch als spam te bestempelen omdat deze woorden gebonden zijn aan iemands werk en levensstijl. Het is voor de verstuurders van spam echter erg moeilijk om achter deze woorden te komen. Graham-Cumming heeft duizenden berichten naar zichzelf moeten sturen, die doormiddel van een stukje HTML-code lieten weten dat ze door het filter waren gekomen. Een spammer zou dit dus moeten doen voor iedereen die hij wil bereiken. Een erg tijdrovende bezigheid die ook nog makkelijk ontweken kan worden door het HTML-deel niet te bekijken. Het proces kan versneld worden door een aantal mailtjes naar bijvoorbeeld alle medewerkers van een bedrijf te sturen. Er is dan een grote kans dat er een aantal woorden gevonden wordt dat ervoor zorgt dat een bericht altijd doorgelaten wordt.

Volgende 14:49
Vorige 13:50

Reacties

«  1  2  »

oftewel onderzoek leid NIET tot manier om spamfilters te omzeilen maar laat juist zien dat het niet te doen is om het te gaan omzeilen omdat het teveel werk is waardoor het rendement niet genoeg is.

Het is niet alleen teveel werk, het is ook niet-uitvoerbaar werk voor een spammer, aangezien hij al zijn doelwitten dan apart moet bekijken qua wat er bij die persoon door kan komen. En het punt van spam is juist dat het met miljoenen tegelijk kan worden verstuurd. Zonder dat aspect is het nutteloos.

Nog even los van het feit dat als de spammer het zou willen, de doelwitten niet zouden meewerken qua vertellen wat er bij hun doorkomt :)

Wat een spammer wel kan doen is meer mail sturen met verschillende woorden erin. Deze woorden kunnen door middel van een klein onderzoek wel geraden worden, aangezien deze volgens het artikel allemaal in de persoonlijke sfeer zitten.

Hetgeen dus betekend dat erg veel spam nog steeds gefilterd wordt, maar dat er ook mail is die er wel doorheen komt.

Ja, maar die woorden waar bij jou mail doorkomt zijn totaal anders dan de woorden waar bij mij mail door het spamfilter komt. Sowieso zitten wij als Nederlanders al vrij veilig omdat 99% van de spam Engelstalig is en ons persoonlijke spamfilter waarschijnlijk veel Nederlandse woorden bevat die sowieso doorgelaten worden.

Ik vind de titel van dit nieuwsbericht nogal stom gekozen eerlijk gezegd, het hele artikel toont juist aan dat het ondoenlijk is om een Bayesiaans filter te omzeilen vanwege die persoonlijke filtercriteria, dus het onderzoek toonde juist aan dat zo'n filter niet of nauwelijks te omzeilen is. De titel suggereert dat dit hele spamfilter weggegooid kan worden, want het is te omzeilen...

Het is een never-ending story he...
De anti-spammers verzinnen wat nieuws, waarop de spammers wéér een nieuwe methode ontwikkelen, en zo gaat het door.

Ik vraag me toch af in hoeverre dit nu echt een oplossing voor de spammers is... stel je pakt een bedrijf met 10000 werknemers en je gaat daar die test op loslaten, dan komt ie misschien met uiteindelijk 3 woorden die een email de spamfilters doet omzeilen. Maar of dat dan representatief is voor de rest van de wereld die allemaal niet bij dat bedrijf werken (en die dus juist die 3 woorden of 2 ervan niet gebruiken) is nog maar de vraag.

Nee, maar als je weet dat die 3 woorden er bij alle 10.000 werknemers doorheen komen dan kun je al makkelijk 10.000 mensen spammen.. 10.000 mail adressen van standaard (bedrijfs) mail adressen + omzeilen spamfilter is wel wat waard hoor.

Wat ik probeerde duidelijk te maken is dat die 3 woorden je er uit haalt waarschijnlijk bedrijfs-specifieke woorden zijn, die bij een ander bedrijf of bij een particulier dus niet werken. Om dus 'goede' woorden te vinden zou je 10000 random mensen moeten testen en dat is een stuk lastiger dan een test in 1 bedrijf organiseren.

En daarvoor moet je dus altijd je interesses aangeven als je, je ergens registreert. Maar daarvoor gebruikt niemand zijn standaard mailadres, toch??

Verder denk ik dat je aan de hand van de domeinnaam van een emailaders wel gedeeltelijk kan herhalen in welke brance het zit (dit geld niet voor hotmail, maar wel voor bijvoorbeeld @[b]uni[b]maas.nl; @philips.nl, @tweakers.com etc.

Ik weet niet waar jij dit post maar ik post het gewoon op tweakers.net hoor :+

Ik was even in de wat, ik dacht aan de email forwarders van de abonnementen:

Email forwarders

Als abonnee kun je maximaal drie forwarders opgeven. Het adres van de forwarder is naam@mytweakers.net / tweakers.org / tweakotine.net. Je kunt deze domeinnamen door elkaar gebruiken. Alle forwarders verwijzen naar dezelfde mailbox.

dacht dat tweakers.com daar ook tussen stond...

Je zou m.i. d.m.v. interesses of domeinnaam hooguit kunnen gokken in welk bereik die doorgelaten woorden zich zouden kunnen bevinden. De werkelijke woorden die door je persoonlijk opgebouwde spamfilter komen zijn waarschijnlijk net even anders, waardoor jouw redenering niet opgaat.
Ik bedoel, ook al zou ik als interesse "draadloze netwerken" aangeven, dat betekent dit niet automatisch dat dit woord door mijn filter komt. Bij de een zal dat misschien "WLAN" zijn en bij de ander "Bluetooth".

Dank je wel, 'Anti-spam' onderzoeker John Graham-Cumming. Volgens mij helpt hij met deze info alleen de Spammers |:(

Natuurlijk niet, hij maakt iedereen bewust van het (kleine) probleem. De spammers waren er anders zelf wel achter gekomen en dan had niemand geweten waarom ze er door kwamen. Nu kan je maatregelen nemen.

Ook een negatief resultaat is een resultaat van een onderzoek. Een onderzoek is altijd geslaagd als je een resultaat hebt. Dat het resultaat niet is wat je wilde hebben is een andere zaak.

Vind je dat ook van de uitvinder van de atoombom?

Het resultaat van het uivinden van de atoombom was geheel het gewenste resultaat. Het einde van de oorlog met Japan en een Bom voordat de duitsers er een hadden.

Ik vraag mijzelf af of het daadwerkelijk zo ``tijdrovend'' is om iemands persoonlijke voorkeur te bepalen aan de hand van een aantal steekwoorden. Tegenwoordig heeft zo'n beetje iedereen wel een eigen web-log, danwel, -pagina. Een beetje webcrawler zou daar al gauw een profiel uit kunnen opmaken met iemands persoonlijke steekwoorden.

Misschien is een volgende ontwikkeling op het gebied van spam-filters het scannen op semantiek? Spam wil meestal iets verkopen en dus heeft de tekst een andere semantiek dan bijv. een bericht van een mailing-lijst.

* 786562 lxtreme
edit: context was niet het juiste woord; ik bedoelde semantiek.

Zwijg maar stil ;.. Straks krijg je naast de gebruikelijke pilletjes berichten ook een heuse encyclopedie in de mail opdat die toch door de filters heen kan komen ...... dat zou pas spammen zijn !

Dat soort mailtjes zijn er dus al. Ze doen dan een soort pseudo html:
<html><body>
de aanbieding
</body>
groot stuk tekst uit een verslag
</html>

het filter ziet dus de stukken extra tekst als goed.

Ik heb nu zo'n 2000 bounce berichten in m'n inbox omdat een spammer zo vriendelijk is geweest een spamrun te doen met mijn email in de From:, en die zijn inderdaad per mail weer verschillend, met de een nog l33tere manieren dan de andere van het coderen van viagra en phentermine in voornamelijk leestekens.

Dus het komt erop neer dat een 'getraind filter' nooit 100% is, en dat er een theoretische manier is om de gaten in het filter te ontdekken - en wel via 'gewoon veel werk' ipv. via slim redeneren. Maar dat werkt alleen als de specifieke gebruiker toestaat dat berichten die door het filter komen die info ook aan de spammer terugsturen.

Als je slim genoeg bent om zo'n filter in te stellen, ben je toch hopelijk ook slim genoeg om dit terugsturen niet toe te staan ... ?

Een andere manier om door de spamfilters heen te komen is gewoon interessante mails te sturen waar mensen op geabbonneerd zijn en waarop ze zitten te wachten. Dan is het namelijk geen spam meer. (weg vna de minste weerstand)

Soms lijkt het wel alsof het een wedstrijd is, terwijl de oplossing gewoon voor de hand ligt: advertenties sturen die de gebruikers willen hebben.

mmmmh Graham Cumming. Ik wil niet vervelend doen, maar die achternaam, is inderdaad wel van toepassing op groot percentage van de spam berichten die ik krijg. ;)

waarom denk je dat hij dit onderzoek is gaan doen ... hij wil natuurlijk woorden vinden om zijn eigen emails door de spamfilters heen te krijgen :)
«  1  2  »

Op dit item kan niet meer gereageerd worden.

Volgende 14:49
Vorige 13:50
VNU Media logo Powered by True

© 1998 - 2008 Tweakers.net - Alle rechten voorbehouden

Uitgever van: