Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Minister: geen actie tegen scrapingsite van Rus met 4,3 miljoen bestanden

Minister Grapperhaus van Justitie en Veiligheid heeft in een brief aan de Tweede Kamer laten weten dat de regering geen stappen zal ondernemen tegen de scrapingwebsite van een Rus, waarop 4,3 miljoen bestanden zouden staan, waaronder bestanden met persoonsgegevens.

In reactie op de vraag van D66-Kamerlid Verhoeven of de minister van plan is om actie te ondernemen tegen de website, zegt Grapperhaus dat het kabinet aan een vrij en open internet hecht. Vanuit die opvatting zegt de minister dat het niet de voorkeur verdient om via Google de gegevens op de website onbereikbaar te maken. Hij vindt dit onder meer onwenselijk, omdat daarmee de gegevens nog niet van het internet zijn verdwenen.

Grapperhaus noemt verder de mogelijkheid voor individuen om een verwijderverzoek in te dienen bij zoekmachines, om zodoende de zoekresultaten met eventuele persoonsgegevens te laten verwijderen. In zijn antwoord noemt de minister verder geen acties die zijn ministerie gaat ondernemen tegen de website.

De minister noemt het een 'kwalijke zaak' dat de documenten van personen inclusief persoonsgegevens online staan op de scrapingwebsite, maar daarbij stelt hij dat het niet op voorhand is vast te stellen dat de gegevens illegaal zijn verkregen. Volgens de minister lijkt het erop dat de bestanden bewust of onbewust door gebruikers op internet zijn geplaatst.

De minister wijst ook op de mogelijkheid van de toezichthouder, de Autoriteit Persoonsgegevens, om op te treden bij schendingen van de Wet bescherming persoonsgegevens. Grapperhaus geeft daarbij meteen aan dat de wet het voor de toezichthouder waarschijnlijk niet mogelijk maakt om in te grijpen, omdat de regels alleen ruimte aan de AP bieden om op te treden als de verantwoordelijke in Nederland is gevestigd en gebruikmaakt van de middelen die zich in Nederland bevinden.

De toezichthouder stelde eerder al dat wat de site doet, zonder meer niet is toegestaan. Niet alleen zou de privacy worden geschonden, maar ook zou het auteursrecht in het geding komen omdat de bestanden zonder toestemming aan de verzameling van de site worden toegevoegd.

Het gaat om de website docplayer, en in mindere mate de zustersite sideplayer. Deze websites verzamelen de gegevens door andere website te scrapen. Volgens onderzoeker Sijmen Ruwhof, die eerder een blogpost aan zijn bevindingen over de website wijdde, hebben de websites wel een goed werkende takedown-procedure waarmee bepaalde bestanden verwijderd kunnen worden. Ruwhof schrijft dat het gehele netwerk van sites zich uitstrekt over 45 domeinen in 19 verschillende landen. Hosting zou in Duitsland plaatsvinden op 42 servers.

Volgens een schatting van de omvang van de site en de inkomsten, zouden de websites de Russische eigenaar een miljoen dollar per jaar kunnen opleveren. Op de site zouden vooral pdf- en Office-documenten te vinden zijn.

Door Joris Jansen

Nieuwsredacteur

10-11-2017 • 11:55

81 Linkedin Google+

Reacties (81)

Wijzig sortering
"In reactie op de vraag van D66-Kamerlid Verhoeven of de minister van plan is om actie te ondernemen tegen de website, zegt Grapperhaus dat het kabinet aan een vrij en open internet hecht."

Mja, vandaar de WIV...

Even los daarvan, is het natuurlijk enorm kwalijk dat a) zo'n site die bestanden heeft weten te bemachtigen en b) er niet tegen wordt of kan worden opgetreden, mede vanwege de standpunten van deze meneer (die hij dan overigens ook wel eens op andere vlakken mag uitdragen, maar dat even terzijde). Maar wat gebeurt er nu als blijkt dat deze documenten gestolen zijn? Dat ze bij bijvoorbeeld overheidsdiensten vandaan blijken te komen en zij die gelekt hebben? Hoe zou de reactie van deze man dan zijn? Want ik geloof nooit dat er dan wel actie zou worden ondernomen...
Mja, vandaar de WIV...
De wet internet veiligheid heeft mijn inziens geen (direct) invloed op een vrij en open internet.
De WIV gaat zorgen voor zelfcensuur, en is daardoor een directe bedreiging voor een vrij en open internet.
Direct niet nee. Maar dat is geen reden om daar verder passief over te blijven en er een verminderd risico in te zien.
Als de overheid iets radicaals wil doen ze dat al sinds mensheugenis in stappen, en dan ook nog manipulatief, en dat heb je ook hier.

Het alfabet is even een sterkteschaal.

Maatregel B is de situatie. Overheid wil uiteindelijk maatregelsterkte Z maar dat geeft uiteraard te veel weerstand dus babystapjes, eerst maar eens maatregelsterkte D, maar om het draagvlak te vergroten roepen ze eerst maatregelsterkte G te willen. Boel commotie. Ok liever gehoorzame burgertjes we luisteren, dan maatregelsterkte D. Acceptatie want kunstmatig draagvlak, want "gelukkig is het geen G".
Vervolgens laat je er een paar jaar over heen gaan en begin je gewoon opnieuw. Voor je het weet ben je bij Z en hebben die terroristen waar deze wetten ons zogenaamd tegen moeten beschermen gewoon keihard gewonnen omdat we niet meer kunnen poepen zonder dat je lichaamsafval door een douanepost moet alvorens het in het rioolnetwerk beland als terrorismemaatregel.

TL:DR; Deze wet is een onderdeel van een spreekwoordelijke bankschroef die langzaam om internet heen wordt opgebouwd en vervolgens wordt aangedraaid.

[Reactie gewijzigd door Koffiebarbaar op 10 november 2017 18:26]

Gezien de hosting in Duitsland valt dit straks onder de GDPR regelgeving. Daarmee zou je in theorie de content kunnen laten verwijderen.
Voor zover ik het begrepen heb, gaat het naar men denkt alleen over bestanden die al openbaar op het Internet stonden? Mensen plaatsen de gekste dingen online op hun eigen website, in een attachment bij een forum-bericht, in een openbare Dropbox-map. Volgens mij had het voor zover bekend alleen om dat soort bestanden.

Dat maakt het niet wenselijk, qua privacy. Maar is wel wat anders dan bestanden verkregen door hacken.
Goed gezegd!

Een toevoeging: Als gestolen goederen aangeboden worden wordt er normaliter wel opgetreden. Het maakt volgens mij niet uit of die meuk gratis wordt weggegeven, het is nog steeds heling (juristen correct me if I'm wrong) volgens mij. Er moet ook gewoon tegen opgetreden worden, de onderdanen van het land waar hij de belangen van behoort te behartigen.
Toch een merkwaardig verschil:

De rechter heeft bepaald dat ISP's de Pirate Bay moeten blokkeren omdat ze auteursrechten schending faciliteren dmv. het toestaan dat gebruiker links naar auteursrechtelijk beschermde inhoud plaatsen. Dus niet eens de inhoud zelf.

En minister Grapperhaus vind dat er in het geval van deze Rus, die niet alleen faciliteert maar daadwerkelijk de rechten schend omdat hij de files zelf op zijn websites host, geen actie nodig is "omdat je een verwijderings-verzoek bij Google kunt doen"

Wat rechtvaardigt die ongelijke behandeling? Of vind de minister dat het arrest tegen de Pirate Bay ook ongeldig verklaard moet worden omdat "het kabinet hecht aan een vrij en open internet"?

Ik hou mijn adem maar niet in tijdens het wachten op zijn wetsvoorstel daartoe...

[Reactie gewijzigd door locke960 op 10 november 2017 13:12]

Meneer Grapperhaus is echt een lachtertje. Wel fijn voor hem dat mensen nu niet meer hoeven te refereren naar zijn eerdere pijnlijke uitspraken die hij heeft gedaan voordat hij minister werd om zijn geschiktheid in twijfel te trekken. De meest recente uitspraken zijn nu ook voldoende om dit in twijfel te trekken, zal wel een tactiek achterzitten. Als ik nu gewoon nog iets dommers zeg of doe, vergeten de mensen het voorgaande. Werkt bij Trump immers ook prima. 8)7
Ja echt hè, dat was ook mijn eerste gedachte. Een jarenlange heksenjacht en heel wat wetswijzigingen zodat er wat mp3'tjes beschermt worden met potentiel flinke boetes als je tegen de lamp loopt. En dan doodleuk beweren dat vanwege een vrij en open internet aan dit soort situaties maar niets gedaan word, kots....
Omdat de eerste linked naar illegaal materiaal en de tweede niet (en ook niet bewezen rechten schend)
Lijkt me toch wel erg voor de hand liggen, nietwaar?
De eerste linkt naar materiaal van bedrijven met veel geld, de tweede linkt naar materiaal van burgers.

De opslag en verwerking van persoonsgegevens moet voldoen aan allerlei wetten, ten eerste moet je een specifiek doel hebben wat de opslag/verwerking rechtvaardigt. Ik kan me niet voorstellen dat dat zo is.
Rare kop en ook de inleiding biedt geen verheldering. Leuk hoor, een scrapingsite met 4,3 miljoen files... Wat voor bestanden? Wat is het probleem? Journalistiek gezien niet echt sterk.

", waaronder bestanden met persoonsgegevens." Dit is toegevoegd en nu is het in ieder geval duidelijk.

[Reactie gewijzigd door MIB75 op 10 november 2017 12:08]

Ik ben zelf maar even gaan zoeken want het artikel verteld inderdaad helemaal niets.

Het gaat dus om een SEO optimized website (docplayer . net) die zich voordoet als file hoster maar gebruikers in de realiteit niet instaat stelt om daadwerkelijk iets te uploaden. De site bevat voornamenlijk gescrapte content (word en PDF files) van openbaar toegangkelijke bronnen op het internet. Geld wordt verdiend door de website vol te proppen met google adword banners. Enige doel van deze website is dus zoveel mogelijk content verzamelen en hosten met als doel zoveel mogelijk traffic naar de site en dus advertenties te krijgen. Content ansich kan dus per toeval privacy gevoelig zijn als deze ergens publiek toegangeklijk was.

Each platform spiders websites in a specific country and looks for PDF and PowerPoint files, copies them, and orders all the files based on the language they’re written in. All the Dutch files will be broadcasted via docplayer.nl, all France content via docplayer.fr, etc. This strategy is excellent for getting these sites to score high in search engines: it’s localized per country, contains a lot of content in the same language and no content is duplicated across these sites.

Very interesting statistics arise

45 domain names are in active use in 19 different countries.
42 dedicated servers in Germany run the whole operation.
24,3 million PDF and PowerPoint files are hosted on all sites combined.
These sites have at least 12.843 incoming links.
23 to 29 million unique monthly visitors for all the sites combined.
Estimated 100 million page views per month.
The sites generate a roughly estimated add revenue of $92,210 each month.
slideplayer.com is ranked as the 6,047 and myshared.ru is ranked as 11,806 most visited site in the world. 11 other sites are also ranked in the top 100,000 list.


https://sijmen.ruwhof.net...s-that-nobody-is-aware-of

[Reactie gewijzigd door Crazyanz op 10 november 2017 12:17]

Waarom worden dit soort sites niet standaard door Google geweerd? Als er hier te veel van bestaan, wordt heel hun search engine waardeloos.
het internet staat vol met Scraping service bedrijven.
Ik snap het probleem niet zo?!.....
Ik denk dat google daar genoeg algoritmes voor heeft ontwikkeld. Een simpel voorbeeld hiervan is dat je site hoger in de ranking komt als je unieke content hebt. Wat nu niet het geval is.
AdWords is van Google, waarom zouden ze een klant met meer dan 1 miljoen omzet verwijderen als hij niets illegaal doet. Gezien het traffic volume is de site relevant. Sterker nog Google krijgt door die site via hun AdWords en Google Analytics, meer inzicht in de netwerken van mensen en hun interesses.

Ik zie alleen maar plus punten voor Google om die sites te behouden. 42 servers? Toeval? https://simple.m.wikipedia.org/wiki/42_(answer) of mindset/marketing? :)

[Reactie gewijzigd door djwice op 19 november 2017 22:25]

zegt Grapperhaus dat het kabinet aan een vrij en open internet hecht
Ah, vandaar ook die prachtige open en vrije sleepwet.
Die sleepwet ligt in het verlengde van een vrij en open internet in ogen van de overheid, ze willen namelijk vrij over al je gegevens kunnen beschikken zonder daarvoor maar ergens een aanvraag voor aftappen in te dienen.
Los van of je het eens bent met de sleepwet, zie ik niet in hoe die het open internet bedreigt.
De overheid ziet het internet wellicht iets te vrij en open :p
Die vrijheid en openheid werkt dan vooral één kant op.
Vraag 4
Bent u bereid om met Google in overleg te gaan om actie te ondernemen
tegen deze website?
Kan iemand me vertellen waarom met Google overlegd zou moeten worden om actie tegen deze website te ondernemen? Wordt de website gehost op servers van Google?
Google zou er voor kunnen zorgen dat de site niet meer te vinden is op google.nl of dat de website in Chrome als kwaadaardig wordt aangemerkt.
Tuurlijk. Maar als ik denk aan "het nemen van stappen tegen een site", zou ik me richten op de ontwikkelaar, uitbater, of host van de site. Wellicht zelfs ISP's. In ieder geval op de bron van de openbaring van de gegevens, en niet op één van de toegangswegen tot de site.

Misschien had de Pirate Bay-blokkade ook beter via Google aangepakt kunnen worden! 8)7
Ik ben het met je eens, dat stappen tegen de hoster van de site,ontwikkelaar etc etc is beter.

Maar wij leven in een wereld, waar onze regering de Politie macht op Internet steeds vaker aan de grote tech reuzen overlaat.
Het is gemakkelijker om onder dreiging van een boete Google, een site uit zijn zoekresulaten te laten halen. Dan in dit geval een takedown verzoek in te dienen bij plusserver.com, waar deze site gehost wordt.
En dan moet je ook een request sturen naar

Bing, DuckDuckGo, DogPile,YippY, Yahoo etc etc.

Als Icann gewoon die dingen afscherm als je dat explicitet vraagt, is er 0,0 een probleem.
Ook Icann moet hier niet tussen zitten. Die regelen enkel de domeinnamen (al dan niet icm. tussenpartijen als SIDN). Je moet echt bij de bron zijn, dus de persoon zelf aanpakken, of bij de hosting partij uit Duitsland de servers waar het geheel op draait offline laten halen. En dan liefst met tussenkomst van een rechter, zodat die kan oordelen of de gegevens ook onrechtmatig verkregen en geopenbaard zijn. Als hij wettelijk gezien niets strafbaars doet, hoeft er natuurlijk ook geen actie ondernomen te worden. Google (cache) is ook gewoon een scraping website, dus nieuw is het allemaal niet.

Als het Icann de domeinnamen offline haalt hebben ze binnen de kortste keren nieuwe domeinen aangevraagd, en zou je in theorie nog steeds op basis van IP adres kunnen verbinden met de servers.
Ik heb het niet over offline halen, ik heb het over een soort 'bel me niet register'

:P als Icann zomaar dingen offline gaat halen zijn we niet blij nee.

Als die informatie niet gedeeld wordt, wordt het ook niet geindexeerd en hebben we dat probleem niet. Je zou altijd een 'request' kunnen verzoeken zodat iemand je gegevens kan inzien mits toestemming van de desbetreffende partij.

Niet zo moeilijk allemaal

[Reactie gewijzigd door Bjorn89 op 10 november 2017 13:38]

Het gaat ook bij lange na niet enkel om WHOIS gegevens. Als ik het artikel zo lees gaat het vooral om bestanden die van websites af komen (pdf/doc), dus niet of in mindere mate om WHOIS gegevens. Simpele bestanden die op een open directory van je webserver staan bijvoorbeeld. Daar lost het Icann dus ook niets mee op.
Ook Icann moet hier niet tussen zitten.
...
Als het Icann de domeinnamen offline haalt...
Nee-hee, je snapt er niets van. De Icann zit er nu eenmaal tussen; van hen moeten de whois-gegevens op het web te raadplegen zijn. Dus die staan op websites, die dan ook weer gescraped worden. Die Rus is niet de bron, de bron is degene die de gegevens openbaar maakt of opdracht daartoe geeft (in het geval van Whois gegevens op websites dus de Icann). Als je die Rus oppakt kunnen er zo weer nieuwe personen zijn die de boel scrapen als er niets bij de bron verandert.

Het zijn dus niet de domeinen van de scrapers die offline moeten worden gehaald, want dan komen er zo weer nieuwe personen voor in plaats ja. De bron is de Icann die niet de whois gegevens moet laten tonen. De SIDN schermt ze toch ook af? Daar zie je alleen de houder (en dat zal meestal een bedrijfsnaam zijn) en een emailadres. That's all.

Dit is maar een voorbeeld van wat er gescraped wordt. Dat kan dus ook iets anders zijn zoals andere gegevens die online staan en Word documenten en PDF's.

Maar zelf was ik dus -buiten mijn macht om- alleen de klos doordat mijn whois gegevens van wat ,com domeinnamen voor iedereen te zien op het web staan. En met mij vele anderen, Google maar eens op die website van die Rus en iedereen die boos is dat ze er met al hun persoonsgegevens op staan. Dan zal je zien dat het vaak door whois gegevens komt die op het web staan.
Ik zou zeggen vraag het aan Kees Verhoeven @KeesVee
wow, dan kunnen we met dit soort uitspraken wel spreken over willekeur tegen zoekmachines. en alle 100+ andere zoekmachines worden voor het gemak buiten beschouwing gelaten?
Als zelfs al een D66 kamerlid weet dat Google de baas is van het internet maar dat een tweaker dat niet weet 8)7
Serieus, het geeft pijnlijk aan hoe veel te ver dat de invloed van Google inmiddels gaat, dat kamerleden blijkbaar denken dat Google de baas is van het internet. Psst. Verhoeven, dat Google van jou is de allergrootste scraper site van allemaal!
standaard overheid mentaliteit: "Dat klinkt heel logisch wat je zegt, dus gaan we dat sowieso -niet- doen!!"
Google serveert advertenties op de website waar de beheerder van de site aan verdient (advertentie-inkomsten worden gesplitst tussen Google en de beheerder). Google zou deze inkomstenbron kunnen afkappen door zijn advertentiebanners niet meer toe te staan op deze sites. Maarja, Google verdient hier natuurlijk ook aan dus ziet zich waarschijnlijk niet snel genoodzaakt om hier in te grijpen.
Hij vindt dit onder meer onwenselijk, omdat daarmee de gegevens nog niet van het internet zijn verdwenen.
Geweldige logica. We hebben weer een zwaargewicht op het ministerie zitten..

Uitbreiding van de Wet op Inlichtingen diensten is dan ook niet wenselijk omdat daarmee nog niet al het terrorisme verdwenen is.
Inderdaad een goede logica. Als je iets doet doe het dan goed, gegevens in Google onvindbaar maken maar ondertussen de gegevens gewoon laten staan is gewoon half werk.
Het is misschien geen definitieve of volledige oplossing maar daarmee is het nog niet onwenselijk. Je kan zelfs nog zeggen dat het niet een efficiënte oplossing is maar dat is allemaal niet hetzelfde als onwenselijk.
Het is toch juist een betere logica? Nee blokkeren vanuit NL lost wat op...iets met VPN's enzo...het probleem is dat mensen die geïnterreseerd zijn in de bestanden er toch wel weten te komen...
De vraag blijft echter zoals MIB75 zegt, wat is het, en waarom mag het niet?
Je zou ook weer kunnen stellen "De regering dult geen concurrentie"
Want ze zitten er juist weer doorheen te drukken dat zij wèl mogen gaan sleepnetten van onze data...klinkt mij weer lekker krom...
hij heeft wel degelijk een punt natuurlijk! het blokkeren bij Google zorgt er niet voor dat de documenten verdwijnen! en aangezien het veelal (zo mogelijk alles) vrije beschikbare documenten waren....is er helemaal geen grond vanuit de wet om iets aan deze site te doen (zonder aangiftes van mensen dan natuurlijk)
Frappant dat er wordt gesproken over eventuele actie tegen die Rus, en niet in de eerste plaats tegen de onbenul die heeft gefaald te voorkomen dat die gegevens überhaupt scrapebaar waren.
Frappant dat er wordt gesproken over eventuele actie tegen die Rus, en niet in de eerste plaats tegen de onbenul die heeft gefaald te voorkomen dat die gegevens überhaupt scrapebaar waren.
Die onbenul die dat toelaat is o.a. de ICANN, want al die gescrapete gegevens komen uit de Whois van .com en .net domeinnamen enzo. Althans, die van mij wel, want die staan nergens anders op het internet gepubliceerd. Zie ook: nieuws: Icann onderneemt voorlopig geen actie tegen registrars die whois-data...

Helaas voor mij ook. Toen ik mezelf had geGoogled vond ik mezelf terug op de website van die Rus. Dus inlcusief voornaam, achternaam, volledig adres en telefoonnummer. Want die moet je verplicht invullen bij een .com domeinnaam, ook als het op naam van een bedrijf staat. En laat ik nu net al 20 jaar een afgeschermd telefoonnummer hebben. Nu niet meer dus. :(

Daarnaast, als je een verzoek doet bij de Rus om het eraf te halen, dan staat het er bij de volgende scrape actie weer op.

Van die slapjanus (en jihadistenknuffelaar) Ferd Grapperhaus had ik niets anders verwacht. "... de Autoriteit Persoonsgegevens, om op te treden bij schendingen van de Wet bescherming persoonsgegevens ..." is niet bevoegd buiten de NL. Maar heel NL kan het zien. Dus je hebt niet veel aan de Wbp hier als al je gegevens op een buitenlandse site staan. Dan maar een klacht indienen eerdaags bij de EU. Dit kan eigenlijk gewoon echt niet. Of de .com domeinnamen en alles van de Icann geheel links laten liggen voortaan.

[Reactie gewijzigd door Slingeraap2 op 10 november 2017 14:42]

Ja, nou betwijfel ik trouwens wat Grapperhaus tegen een random Rus kan uithalen.

Als Kim Jung Un actie wil ondernemen tegen een Nederlander die gegevens online heeft staan die hem niet aanstaan of volgens hem in strijd met de wet zijn (bijvoorbeeld kritiek op Kim Jung Un), mag ik toch ook aannemen dat hij hier precies nul jurisdictie heeft.
Die random Rus heeft alleen 42 servers in Duitsland staan, waarmee hij de hele wereld bedient. En Duitsland is EU, dus het lijkt me dat er gewoon Europese strenge privacy-wetten gelden?

En daarnaast, de piratebay website is toch ook gewoon geblokkeerd in NL? Niet dat je daarmee de bron aanpakt, maar toch.

[Reactie gewijzigd door Slingeraap2 op 10 november 2017 14:50]

Nee, alleen bij een paar providers. Ik kan er nog steeds op (online.nl) en zoniet, dan zijn er nog altijd proxy's.
Okee.

Ja die proxy's, da's een ander losstaand ding. En ik denk niet dat iemand die Rus zijn site gaat namaken. Nou ja, je weet nooit. :)
Er zijn enkele websites op Darkweb die vergelijkbaar zijn, in principe doet hij niks anders dan wat Google ook doet/kan. Probleem ligt eerder bij icann en domein registrars dan bij Google/Persoon zelf.

:)

Niet dat ik het met bovenstaande post goedpraat. Maar als er zoiets is als een 'bel-me-niet' register voor telefoonnummers, dan snap ik niet dat het er niet kan zijn voor domeinnamen.

Is dit overigens alleen bij .com domeinen, want er zijn zoveel alternatieve domeinnamen tegenwoordig.

[Reactie gewijzigd door Bjorn89 op 10 november 2017 12:49]

Probleem ligt ook niet bij Icann. Als je Icann het domein offline laat halen kun je het nog steeds op IP benaderen. Je moet echt bij de hosting zijn, dus de servers offline halen.
Hier een voorbeeld van een webpagina waar die Rus o.a. zijn info vandaan haalt: http://whois.domaintools.com/tweakers.net
Effe naar beneden scrollen en je ziet alle gegevens. Die worden dus gescraped. Voor een persoon of bedrijf / ZZP'er die vanuit het eigen huis werkt, liggen dus alle persoonsgegevens (ook contactpersoon) op straat.

Leuk de -1 voor mijn poging tot wat hulp hierin op dit artikel. Ik herhaal voor de 5e keer, dit was dus de enige plek waar mijn gegevens op het internet stonden en die zijn dus gescraped. Vanaf een website dus, vosManz.
Ben ik met je eens, maar dat heeft niets met dit bericht te maken. Dit bericht gaat over een site die gegevens uit bestanden van andere websites haalt. Dus niet uit de WHOIS gegevens, maar uit bestanden op de site zelf.
Hier een voorbeeld van een webpagina waar die Rus o.a. zijn info vandaan haalt: http://whois.domaintools.com/tweakers.net
Effe naar beneden scrollen en je ziet alle gegevens. Die worden dus gescraped. Voor een persoon of bedrijf / ZZP'er die vanuit het eigen huis werkt, liggen dus alle persoonsgegevens (ook contactpersoon) op straat.
Nogmaals, dat heeft niets met dit bericht te maken. Ik weet dat de WHOIS gegevens openbaar zijn, en dat die te scrapen zijn. Dat praat ik niet goed, maar heeft NIETS met dit bericht te maken.

Dit bericht gaat over een site van een rus die BESTANDEN scraped. Dat er sites zijn die WHOIS gegevens scrapen en misbruiken, vast, maar deze site zo te zien niet.

Om je eigen voorbeeld te gebruiken, ik zie op die pagina dat het domein is geregistreerd op dns @ tweakers.net. Als ik die opzoek op de betreffende site van de rus, krijg ik 0 nix nada noppes aan resultaten:
docplayer [punt] nl/search/?q=dns@tweakers.net

Zoek ik enkel op 'tweakers' dan krijg ik wel heel wat resultaten, maar dus enkel documenten en geen WHOIS gegevens:
docplayer [punt] nl/search/?q=tweakers
Voor de zevende en allerlaatste keer: ikzelf sta op die site van de Rus doordat die Rus mijn openbare whois-gegevens heeft gescraped. Hij scrapet dus wel websites met whois gegevens.

[Reactie gewijzigd door Slingeraap2 op 15 november 2017 15:04]

Ja, laten we vooral de website blokkeren en net doen alsof hij niet meer bestaat. Daar verdwijnen je gegevens echt niet mee van het internet.
Nee okee, dat weet ik ook wel, dat zou niet de ideale manier zijn. Maar iets is beter dan niets. Nu zie je als NL'er wel al die gegevens, en anders niet. Het zijn denk ik toch alleen landgenoten, die de gevens van die website zouden kunnen/willen misbruiken.
En laat ik nu net al 20 jaar een afgeschermd telefoonnummer hebben. Nu niet meer dus. :(
Je kon van tevoren weten dat whois die gegevens openbaar maakt. Als je je echte telefoon nummer wilt afschermen koop je een goedkope prepaid gsm en geef je dat nummer op.
Bij .nl zie je niets, alleen het emailadres van je bedrijf.

Maar goed, voor Icann domeinnamen is het wel zichtbaar inderdaad ja. En in dat geval zou een prepaid gsm wel handig geweest zijn ja. Of een 085 nummer. Bij een .com hoef je overigens niet je hele voornaam in te vullen, hoor ik net van mijn domeinnaamleverancier, een initiaal is ook goed, dat scheelt weer wat.
De ICANN staat privacy protect/proxy wel toe, waarmee je de gegevens kan verbergen achter een proxy, dit voorkomt in ieder geval de problemen die jij beschrijft. Tevens is het maar zeer de vraag wat er in de toekomst gaat gebeuren zeker ivm de GDPR die eraankomt.
Het artikel gaat niet, of in mindere mate, over de WHOIS gegevens die het ICANN publiceert.
Deze websites verzamelen de gegevens door andere website te scrapen.
Het gaat dus om een site die de inhoud van sites kopieert en publiceert. Eigenlijk hetzelfde als wat Google doet met de zoekresultaten en de cache-optie, maar dan specifiek door soort van de cache-optie van Google eenvoudig inzichtelijk te maken.
Ik geef alleen als voorbeeld de Icann aan, die dat laat gebeuren. Want in mijn eigen geval -ik heb dus voor de rest nergens persoonsgegevens online staan- is het duidelijk de Icann whois die gescraped wordt.
Volgens de blogpost zijn er belastingpapieren op die site beland. Ik zou het over deze boeg gooien als ik D66 was. Immers is het zeer waarschijnlijk dat de Belastingdienst dus ergens belastingpapieren openbaar heeft gemaakt, en daardoor WBP heeft overtreden.

Zou je in dit geval als burger mogen weigeren je belastingaangifte in te vullen totdat de afkomst van deze bestanden is achterhaald? Dat zou wel leuk zijn :+
Je mag gerust weigeren, dat mag altijd :+
Belastingdienst die aangiftes openbaar zet? Wat een rare vaststelling/aanname, is dan nogal een data lek. Denk eerder dat het gaat om de 'eigen kopie' van de belastingbetaler die ergens te openbaar staat.
deze site legt dus onbewust allerlei lekken bij grote en kleine instanties bloot. De reactie van onze overheid was in eesrte instantie: wegwerken, zand erover, onzichtbaar maken.
Ferd heeft dat terecht tegengehouden.

Dan wachten we nu op de sancties die alle bedrijven/instanties te wachten staan voor het lekken van persoonsgegevens...? Toch?
De voornaam van de minister is Ferdinand.
https://nl.wikipedia.org/wiki/Ferdinand_Grapperhaus
Op meerdere site wordt over Ferd gesproken.
Ja, ik wou ook Ferdinand schrijven, tot ik onderaan zijn eigen brief zag dat hij zelf afsloot met 'Ferd'...
Dat kan ook de vader zijn: https://nl.wikipedia.org/wiki/Ferd_Grapperhaus, in tegenstelling tot de huidige minister (de zoon): https://nl.wikipedia.org/wiki/Ferdinand_Grapperhaus .

Op dit item kan niet meer gereageerd worden.


Apple iPhone XS Red Dead Redemption 2 LG W7 Google Pixel 3 XL OnePlus 6T (6GB ram) FIFA 19 Samsung Galaxy S10 Google Pixel 3

Tweakers vormt samen met Tweakers Elect, Hardware.Info, Autotrack, Nationale Vacaturebank en Intermediair de Persgroep Online Services B.V.
Alle rechten voorbehouden © 1998 - 2018 Hosting door True