Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 53 reacties
Submitter: nan0x1

Een onderzoek, dat is uitgevoerd door de universiteit van Cambridge, heeft uitgewezen dat de hoeveelheid spam die op een e-mailadres binnenkomt in hoge mate afhangt van de beginletter van de naam waarmee het adres begint.

Verdrinken in spamVoor zijn onderzoek analyseerde Richard Clayton van de universiteit van Cambridge 550 miljoen spamberichten die de klanten van provider Demon tussen 1 februari en 27 maart van dit jaar ontvingen. Het bleek dat mail voor adressen beginnend met a,m,s,r en p voor ongeveer 40 procent uit spam bestond. Voor de adressen beginnend met q, z of y was dat maar 20 procent. Volgens Clayton wordt dit fenomeen veroorzaakt door de manier waarop veel spammers aan hun mailadressen komen.

Junkmailers proberen vaak adressen te vinden door de naam van een werkend adres voor een ander domein te plakken, in de hoop dat ook dit een geldig mailadres is. Aangezien er veel meer namen beginnen met een a of een m dan met een q, zou dit een verklaring kunnen zijn voor het verschil. Overigens verklaart dit verschijnsel de verschillen slechts ten dele. Uit het onderzoek bleek ook dat adressen die met een u beginnen, tegen de 50 procent spam in hun mailbox kregen, hoewel er relatief weinig namen met een u beginnen. Volgens Clayton is er dan ook nog meer onderzoek noodzakelijk om de verschillen te verklaren, zo meldt BBC News.

Moderatie-faq Wijzig weergave

Reacties (53)

Zelf merk ik dat er 3 type spambots zijn:
- zoekt 'echte' adressen dmv scraping (dus pakt een adres van een site af)
- neemt mogelijk echte adressen (info@ , webmaster@ , admin@, etc.)
- gokt adressen (adam123@ , eva456@ , etc.)

Daarnaast worden er ook heel veel adressen verkochten door bedrijven (met name oostblok landen) of worden intern gebruikt voor 'mailings' (amerika, azië).

Het enige wat men kan doen om het spamprobleem op te lossen is ervoor zorgen dat alle spam herkent wordt, en als dat niet automatisch kan, dan door een gebruiker. Om dit goed te regelen zullen alle mail en anti-spam organisaties moeten samenwerken.
En wat moet ik hier nu mee?

Een ander mailadres nemen? Dan nemen ze op een gegeven moment die letters ook wel mee.
Lekker dat dit soort dingen onderzocht worden, maar in feite heb je gewoon niets aan het resultaat, je kunt er niets mee. Het enige wat je kunt is zeggen 'Oh, wat leuk, dat wist ik niet.'.
Jij hoeft er helemaal niets mee.

Maar voor bijvoorbeeld ISP's kan dit wel heel interessant onderzoek zijn. Hoe kan het bijvoorbeeld dat op e-mail adressen beginnend met de letter u relatief veel spam komt terwijl er slechts weinig namen beginnen met een u. Vervolgonderzoek kan leiden tot inzicht in de manier waarop spammers adressen vergaren en daardoor ook tot betere spamfilters en bestrijding. Dat jij niet direct een applicatie ziet voor het onderzoek wil niet zeggen dat het niet nuttig is en dat er niet in de toekomst op doorgewerkt kan worden en wel een mogelijk nuttige toepassing komt. Als iedereen zou denken zoals jij zouden we nog steeds in het stenen tijdperk leven.
"Het bleek dat mail voor adressen beginnend met a,m,s,r en p voor ongeveer 40 procent uit spam bestond. "

Wel erg toevallig dat e-mail adressen waarbij de eerste letter uit het woord "spam" komt, veel meer spam ontvangen. Misschien is het een goede taktiek om de benaming voor het fenomeen "spam" regelmatig te wijzigen, zodat de spammers hun spamlijsten ook aanpassen op de beginletters uit deze nieuwe naam. Zo kunnen we er voor zorgen dat de spam evenredig wordt verdeeld, en dat bepaalde mensen niet meer spam ontvangen dan andere mensen..

Nog een beter idee is natuurlijk om een nieuwe letter te bedenken, en spam de naam van deze nieuwe letter te geven. Vervolgens zorg je ervoor dat deze letter niet in e-mailadressen gebruikt kan worden. De spammers gaan dan massaal mail sturen naar e-mailadressen die met deze nieuwe letter beginnen, maar die bestaan helemaal niet. Tadaaa... Spamprobleem opgelost! :)
Mijn spam mail begingt tevens ook met het woord "Spam". Het grappige is dat ik me via dat mailadres in schrijf voor alle spam gevoelige sites maar ik via mijn privé mail toch meer spam krijg.

Dit zal hoogswaarschijnlijk zo zijn omdat de "Spam" adressen in het algemeen niet gelezen worden tenzij je zo'n typisch activatie mailtje nodig hebt en dat die adressen dus voor de spammers niet tot amper aantrekkelijk is.

Ik geloof zelf dat ze de spam bots zodanig programeren om voor en achternamen te verzamelen en het in een database op slaan en vervolgens de namen gaan combineren om op die manier spam-mails te versturen.

Ik ben geen deskundige op dit gebied maar ik geloof dat het zo werkt.
Die SPAM'Rs sturen zichzelf en alle anagrammen van hun beroep veel mailtjes. Ik pleit dan ook voor de benaming QQQ voor mensen die spam sturen, dan hebbene r de minste mensen last van :-D

[Reactie gewijzigd door Kagiso op 2 september 2008 10:43]

Uhm, conclusie is, er is meer onderzoek nodig? Heel fijn.
Als je een onderzoek doet en je kunt binnen het tijdsbestek daarvan je waarnemingen niet verklaren, kun je wel een beetje gaan zitten raden en dan roepen dat je de oplossing hebt, maar je kunt je ook verantwoord gedragen en zeggen dat je niet weet waarom je metingen er zo uitzien.
Gevolg is dan dus automatisch dat als iemand een verklaring wil, er meer onderzoek nodig is. Dat is toch niet zo raar?

Je zou hoogstens kunnen zeggen dat een onderzoek niet klaar is tot je alle antwoorden hebt, maar daar denken budgethouders heel anders over :P
"Er is meer onderzoek nodig" is zelden de conclusie, maar veel vaker gegeven in de vorm van een aanbeveling, en meestal ook wat specifieker dan dit. Het meeste onderzoek levert overigens meer vragen op dan antwoorden. Dat is niet slecht, dat is gewoon hoe wetenschappelijk onderzoek werkt. Het levert ook leuke projectjes op om afstudeerders of eventueel promovendi op te zetten.
meer onder zoek nodig, betekent we snappen het niet.. Dat ze dat nu toch gewoon eens toegeven.. en het easy maken en het aan bekende spammers vragen hoe ze te werk gaan kost een hoop geld en energie minder!
Alleen spamberichten aan klanten van provider Demon zijn onderzocht.
Er zijn diverse redenen te noemen dat bij andere providers een andere verdeling van de spam van toepassing is. Ook is blijkbaar geen onderzoek gedaan naar de berichten die wel bij de provider binnenkwamen maar niet naar een klant konden worden doorgezet (bijv. via 'catch all'). Cambridge zoekt de oorzaak van de invloed van de eerste letter van je mailadres op de hoeveelheid spam die je krijgt, in de manier waarop spammers werken. Misschien hadden ze daar beter een onderzoek naar kunnen doen? Dan had je ook iets gehad aan het resultaat, t.b.v. het aanpakken van spam. Nu zou je hooguit kunnen zeggen dat je beter geen emailadres kunt nemen dat met genoemde letters begint, of adviseren dat spamfilters meer de focus leggen op deze mailadressen?!?

550 miljoen spamberichten in 2 maanden is weliswaar een groot getal maar dit lijkt me toch niet zo heel veel. Hoeveel klanten heeft Demon? Hoeveel mailtjes (ook niet-spam)worden dagelijks ontvangen? Maar goed, het zal vast wel een representatieve steekproef zijn geweest.....(En dat lijkt me veel belangrijker dan het absolute aantal!)

Wanneer het enige doel van het onderzoek was om de verdeling van spamberichten per beginletter te bepalen dan is dat hooguit een paar uur werk geweest, inclusief het verzamelen van de gegevens.


Ik vraag me alleen af hoe ze bij die letter 'r' komen. Dat de overige letters (s,p,a, en m) spam opleveren is wel duidelijk........ Het klinkt bijna als een hoax! Zou je eigenlijk onderzoek naar moeten laten doen.... :+
" Ik vraag me alleen af hoe ze bij die letter 'r' komen. Dat de overige letters (s,p,a, en m) spam opleveren is wel duidelijk........ Het klinkt bijna als een hoax! Zou je eigenlijk onderzoek naar moeten laten doen.... :+ "


dat vind ik best ver gezocht.. maar je hebt een punt..
r = receptie@bedrijf.nl, reception@bedrijf.com, register@bedrijf.nl, registreer@ registratie@ registration@.
"Lies, damned lies, and statistics" Dit is gewoon verdraaien van gegevens, als ik een email adres met een q aanmaak en vervolgens me inschrijf op elke mogelijke site krijg ik veel meer spam dan wanneer ik een email adres met een m aanmaak en er vervolgens niets mee doe. Dat heeft helemaal en compleet niets met de beginletter van mijn email adres te maken. Laat die Clayton stoppen met zn onderzoek en iets nuttigs gaan doen, dit helpt helemaal nergens mee.
Je begrijpt het niet helemaal geloof ik: dit gaat om onderzoek naar grote aantallen, met e-mailadressen van mensen die daar niet bewust iets bijzonders mee gedaan hebben. Dat jij als individu ervoor kunt zorgen dat je meer of minder spam krijgt op een eigen e-mailadres zal best, maar is totaal niet relevant.

Kwestie van interpreteren en niet "damn lies and statistics". Voor mij klopt het onderzoek deels wel: ik had m'n gmailadres nog nergens gebruikt toen ik al spam kreeg erop. Waarschijnlijk van een spammer die m'n username van een ander mailadres ervoor geplakt heeft. Qua hoeveelheid spam klopt het voor mij echter niet, maar dat maakt het onderzoek nog niet ongeldig.
Het onderzoek (of in ieder geval dit artikel) stelt dat de oorzaak van meer spam een verkeerde keuze van de eerste letter van je email adres is. Maar de oorzaak van meer spam ligt helemaal niet bij welke letter je gebruikt. Realistischer lijkt het me dat lijstjes met standaardnamen een grotere hoeveelheid a,m,s,r en p-woorden hebben. Dus de kans dat je meer spam krijgt als je zo'n standaardwoord gebruikt is groter. Maar als jij als email adres aeuiarjgaipoerjpgaeijrk@... hebt, dan ga je echt niet opeens meer spam ontvangen dan wanneer je qeuiarjgaipoerjpgaeijrk@... had genomen. De conclusie is gewoon veel te algemeen, het ligt namelijk niet aan de letter a, maar aan een combinatie van letters die toevallig begint met de a (blijkbaar zijn er dus meer lettercombinaties met een a, die makkelijker te raden zijn, met als gevolg dat het gemiddelde voor emailadressen met een a hoger ligt).

Dat is wel degelijk het verdraaien van gegevens, en wat mij betreft valt dit onderzoek dus wel degelijk onder "damn lies and statistics". Overigens is 'interpreteren' precies waadoor die uitspraak is ontstaan, want door de cijfers zo te verdraaien kun je er zoveel uit zeggen wat helemaal niet perse waar hoeft te zijn.

[Reactie gewijzigd door Toolskyn op 2 september 2008 14:13]

Zit wel een kern van waarheid in overigens. Ik zoek het echter niet in beginletters maar in veelvoorkomende namen. Toen mijn werkgever een jan@ adres aanmaakte had ik meteen bij het openen van mijn mailbox voor de eerste keer al 20 spamberichten. Inmiddels is het adres veranderd naar voorletter.achternaam@ en heb ik in 5 maanden nog geen enkel spambericht gehad. En dat voor een mailbox zonder spamfilter.
Dat is dan waarschijnlijk een kwestie van tijd...
ja natuurlijk is dat een kwestie van tijd, - maar in zijn bewering maakt ie wel een heel duidelijk punt

hoe envoudiger de user tag in het adress hoe makkelijker te raden en dus te spammen.

hoveel spam krijg je niet op info@ admin(istrator)@ sales@ marketing@ etc.
dan zullen jan kees klaas john gerald etc ook wel in het lijstje staan...
Inderdaad, uit ervaring weet ik dat de info@... , admin@... , sales@... , en dergelijke veel gebruikte voorvoegsels nogal vatbaar zijn voor spam. En dan hoef je er nog niet eens mee rond te zwieren en te registreren bij verschillende websites, ze vinden je toch wel.

Bij een dergelijke emailnaam kan je gerust een spamfilter installeren of je zal de naam moeten veranderen naar iets ongebruikelijkers. Iets in de trant van i.nfo@... of ad.min@...
En we leven in nederland, dus waarom geen informatie@bedrijf.nl en verkoop@bedrijf.nl en ondersteuning@bedrijf.nl en personeelzaken@bedrijf.nl en sollicitatie@bedrijf.nl en klantendienst@bedrijf.nl en webbeheerder@bedrijf.nl en afdelingmarketing@bedrijf.nl

Misschien wel langer, maar minder vatbaarder. Bovendien, het geeft ook nog een leuk sausje aan het adres en lekker Nederlands weer :-)

[Reactie gewijzigd door Wim-Bart op 2 september 2008 17:07]

dit zegt dus gewoon iets over het soort mensen dat een e-mail adres beginnend met a m s r of p kiest ;)
Ik denk dat ze het over vergelijkbare situaties hebben.
dat klakkeloos registreren op alles wat maar los en vast zit resulteerd in een lading spam was al wel duidelijk.
Dat is relatief. Om te voorkomen dat hij onderzoek doet en toevallig 60% van zn doelgroep zich dolgraag inschrijft op allerlei websites en mailings, heeft hij 550 miljoen emails 'geanalyseerd'. Ik denk dat hij met die hoeveelheid emails ook wel een vrij grote doelgroep heeft gekozen, en die dus als doorsnee kan worden genomen van de emailadressen wereldwijd.
TOch gaat dit niet altijd op.

Mijn hotmail adres gebruik ik om te gebruiken voor het inschrijven op nieuwsbrieven, sites ed. mijn xs4all adres gebruik ik prive(geef ik dus alleen aan vrienden ed).

Mag t nu juist nou net zijn dat er op mijn xs4all adres meer spam binnen komt dan op mijn hotmail adres.

[Edit]
Mijn hotmail adres begint overgens met een N en mn xs4all adres met een P.

[Reactie gewijzigd door p-de-geus op 3 september 2008 00:23]

Ja dat is niet zo vreemd... er zijn niet echt veel namen met een q, z of y dus daar zullen ook een stuk minder email adressen van zijn en is de kans dat deze in een spam lijst komen.

Want dat is eigenlijk het grootste probleem mensen die email adressen zo maar open op sites posten en dus door bots worden opgepakt en die lijsten worden dan onderling weer gedeeld en is het einde zoek.

Een beetje opletten met waar en met welk email adres je gebruikt om ergens neer te zetten. Ik heb sowieso een email adres wat ik gebruik om minder belangrijke websites en zo. Maar dan nog als het even kan gebruik ik het volgende:

mijn*~dot~*mail*~at~*gmail*~dot~*com

Je ziet toch steeds meer bots die *dot* al herkennen met een tilde er tussen zal dit wat minder zijn. Maar zeker op forums als je bijvoorbeeld je email voor msn of zo in vult moet je altijd zo'n systeem gebruiken anders heb je binnen no time bergen spam want je adres wordt gewoon zonder enige bescherming in je profile gezet.

Mijn eigen privé email adres heeft nooit spam en deze begint toch echt met een R :)
Ja dat is niet zo vreemd... er zijn niet echt veel namen met een q, z of y dus daar zullen ook een stuk minder email adressen van zijn en is de kans dat deze in een spam lijst komen.
Het punt is juist dat een email adres met bepaalde voorletters elk zelf minder spam krijgen.
Niet dat er in totaal minder spam naar zulk soort email adressen wordt verstuurd.

Jij beweert nu dat mensen met een email adres die begint met q z of y minder vaak hun email adres op sites posten.
Catch all op je domeinen is ook ' leuk' , ik krijg spam a la: 20938490 at mijndomeinen.nl ksdjfhskdfh at mijndomeinen.nl joop123 at mijndomeinen.nl 123joop at mijndomeinen.nl
(Ja dat staat al uit inmiddels)
En ik denk dat er gewoon veel (meer) mensen een email adres hebben met genoemde letters, ergo, men 'onderzocht' slechts dat wat gewoon zo is, ontdekte iets eigenlijk.
Wellicht komen dus volgend ' onderzoek' andere letters OF cijfers! :) slechter uit de bus.

Edit: deels concludeert men wat ik ook denk:
"Aangezien er veel meer namen beginnen met een a of een m dan met een q, zou dit een verklaring kunnen zijn voor het verschil."

[Reactie gewijzigd door notsonewbie op 2 september 2008 09:55]

Ik krijg me spam meestal omgekeerd, in de from:, mail server ergens ter wereld bepaald dat 't spam is en stuur vrolijk een berichtje naar mij om dat te vermelden.

Qua catchall op m'n domeinen moet ik eerlijk zeggen dat het tot nu toe reuze mee valt, op m'n normale isp adres.. tja, die heb ik nu 12 jaar en wie begon er vroeger nou niet naief op internet... maw: 60-70% spam elke dag.
Mijn e-mailadres begint met rams :+

Bij mij zal dus wel 40% van 40% van 40% van 40% van de e-mail uit spam bestaan?

/omgekeerde logica ;)

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True