Hoofdcategorieën
Device Settings

GPD publiceert per abuis nummers bekende Nederlanders - update

Door Arnoud Wokke, woensdag 12 augustus 2009 15:41, views: 106.403

De GPD, de persdienst van de Nederlandse regionale kranten, heeft via Google abusievelijk de telefoonnummers van vele bekende Nederlanders gepubliceerd. In de database staan onder meer Geert Wilders, Mart Smeets en Gerard Spong.

Een GPD-webserver die voor een intranet bedoeld is maar toch via het internet bereikbaar blijkt te zijn, biedt toegang tot een database met duizenden telefoonnummers van bekende en minder bekende Nederlanders. De journalisten van de GPD - de dienst die voor veel Nederlandse regionale kranten nieuws en achtergrondverhalen maakt - maken gebruik van de database om telefoonnummers van contactpersonen te zoeken en op te slaan.

De GPD-database omvat duizenden telefoonnummers en andere privé-gegevens van politici, journalisten, presentatoren en andere bekende Nederlanders. Zo zijn er de actuele telefoonnummers van onder meer Geert Wilders, Jort Kelder, Frits Wester, Mart Smeets, Felix Meurders en Gerard Spong in te vinden. De meeste van hen reageerden verbaasd dat hun telefoonnummer zomaar vindbaar is. Veel entry's zijn echter verouderd, zoals die van premier Jan-Peter Balkenende en Marco Borsato.

Het vinden van de database is niet moeilijk: het uitvoeren van een Google-zoekopdracht met 'site:' en het ip-adres van een GPD-site is afdoende om een lijst met telefoonnummers te krijgen. De site is weliswaar via een login afgeschermd, maar in de tekst van de zoekresultaten en via de Google-cache zijn vrijwel alle gegevens zichtbaar. Normaal wordt een dergelijke database afgeschermd door via een whitelist alleen bepaalde ip-adressen toegang te geven en worden spiders van zoekmachines als Google geweerd met het gebruik van een robots.txt-bestand.

De GPD is verbaasd over het lek dat Tweakers.net ontdekte. "Het is natuurlijk niet de bedoeling dat mensen zomaar in onze database van contactpersonen kunnen kijken", aldus een woordvoerster van het persbureau. "Een extern bureau onderhoudt de webserver voor ons." Inmiddels is het intranet op de webserver niet meer bereikbaar, de zoekresultaten en de pagina's in cache zijn nog altijd zichtbaar.

Database GPD: entry Frits WesterGPD-lek: Gerard Spong

 

Update, 20.45 uur, de cache van Google lijkt inmiddels geleegd

Volgende 16:13 EA legt merknamen Populous en Theme Park vast
Vorige 15:13 Dynavox bouwt draagbare spraakcomputer voor gehandicapten
Advertentie

Reacties

«  1  2  3  4  5  6  7  »

"Een extern bureau onderhoudt de webserver voor ons. We zullen dit euvel zo snel mogelijk verhelpen."
Het lijkt me slimmer als ze Google benaderen om snel die entries te laten verwijderen.

Het probleem ligt moeilijker dan dat... De server waarop die gegevens staan, zouden geen open porten mogen hebben naar het internet, en zéker geen open poort waarop software luistert die te exploiten is...

*knip*

Dat ze maar meteen de ftp naar buitenaf ook sluiten...

Admin-edit:Hoewel misschien goed bedoeld, de exploits ook daadwerkelijk plaatsen gaan me wat te ver

[Reactie gewijzigd door Cloud op woensdag 12 augustus 2009 16:49]


Net even via Google geprobeerd en via de cache zijn er op dit moment nog steeds nummers te vinden, onder andere het mobiele nummer van Geert Wilders.

Wat ik veel grappiger vindt, is dat ik nu het 06 nummer heb van meneer Balkenende :P

Even in tweakers.net style: 06-5334<blur>
Slecht! Ik krijg een of andere erik aan de telefoon :o :'(

[Reactie gewijzigd door r-vos op woensdag 12 augustus 2009 16:19]


Veel entry's zijn echter verouderd, zoals die van premier Jan-Peter Balkenende en Marco Borsato.
Proficiat :+

Too bad, niet goed gelezen. Schijnbaar had iemand het dus al geprobeert ;) Hahaha
Kim holland staat er ook tussen. :')

Kim dr (oude) nulzes is in gesprek :')

Edit:

Wow, minister Rouvoet :P

[Reactie gewijzigd door r-vos op woensdag 12 augustus 2009 16:30]



Half Nederland loopt die mensen te bellen. Heb al een interview op de radio gehoord van volgens mij degene die nu het oude nummer van Balkenende heeft, die werd compleet gek van die rinkelende telefoon.

Johan Vlemmix heeft overigens al meer dan 200 telefoontjes beantwoord vandaag, en volgens mij blijft hij er gewoon mee door gaan ook. Dat vind ik dan wel weer een topactie :D.

Misschien beetje offtopic maar was het niet netjes geweest van Tweakers om dit 'lek' eerst te melden en ze de tijd te geven het op te lossen voordat er over bericht werd?

a joh zo communiceren ze beter met hun fans :P kunnen die ook eindelijk es ff babbelen met johan :z

Tjongejongejonge dan noem je ook een 1steklas randdebiel ook he, Johan Vlemmix de nooit volwassen geworden kleuter (of moet ik zeggen kabouter :D)

Normaal wordt een dergelijke database afgeschermd door via een whitelist alleen bepaalde ip-adressen toegang te geven en worden spiders van zoekmachines als Google geweerd met het gebruik van een robots.txt-bestand.
IP-adressen zijn oke, maar een robots.txt om te zorgen dat gevoelige informatie niet in een zoekmachine terecht komt? Betekent dus dat die informatie voor iedereen wel gewoon te zien is. Zoekmachines die geen gehoor geven aan robots.txt indexeren het dus gewoon. Gewoon niet online beschikbaar maken dit soort dingen, klaar. En moeten mensen er toch vanaf een externe locatie bij, dan hebben we daar VPN voor uitgevonden. Kan ook nog eens mooi versleuteld worden.

[Reactie gewijzigd door Mafkees op woensdag 12 augustus 2009 16:42]


"De site is weliswaar via een login afgeschermd, maar in de tekst van de zoekresultaten en via de Google-cache zijn vrijwel alle gegevens zichtbaar."

Hoe kan een Google spider nou ergens komen wat voor bezoekers dmv login is afgeschermd?

Doordat de spider er wel toegang tot heeft, omdat de googlebot useragent waarschijnlijk wel toegestaan word. Dit gebeurt bij een aantal websites onterecht, een uurtje surfen met de googlebot useragent maakt dit al snel duidelijk ;).

Dat vroeg ik me ook of. Robots.txt is leuk, maar als die pagina's niet zonder login kunnen worden opgevraagd dan kan de google spider er ook niet bij, dus dan zou robots.txt niet eens nodig zijn.

Edit @kokx: waarom zouden ze de googlebot useragent expliciet toegang geven tot afgeschermde gegevens?

[Reactie gewijzigd door Edmond Dantes op woensdag 12 augustus 2009 15:52]


OA nieuws-sites en dergelijke doen dat nog wel eens. Wel indexeren in Google, maar "echte" gebruikers andere content voorschotelen.

Kan ze op een behoorlijke penalty van Google komen te staan overigens.

Daar is het natuurlijk wel logisch, je wil dat niet-leden je nieuws kunnen vinden, maar niet dat ze het kunnen lezen zonder in te loggen (lees: te betalen). Uiteraard laat je het dan wel (gedeeltelijk) indexeren.

Maar een database met contactgegevens? Waarom zou je die expliciet open zetten voor de googlebot user agent?

Omdat deze mischien intern the google search appliance gebruiken.

zie hier : http://www.google.com/enterprise/search/gsa.html


Deze gebruiken ze dan waarschijnlijk intern en omdat je alles wilt doorzoeken hebben ze het met een user agent 'beveiligd'. Beter hadden ze dit op IP nivo kunnen doen, maar ja.... iedereen denkt tegenwoordig dat ze systeembeheerder zijn en dan worden deze domme fouten gemaakt.

Ries

die mooie pagina's worden toch vanuit een database gevuld lijkt me. dan kan je net zo makkelijk een pagina maken waar je de query kan aanpassen, oftewel je eigen zoekmachine bouwen die binnen de database zoekt. ik ben benieuwd of ze nou echt zo stom zijn of dat er wat anders (opzet) in het spel is.

Z'n GSA unit wordt geïnstalleert in het lokale netwerk (een los stuk hardware dus) bij een bedrijf zelf. Gebruikers (klanten/medewerkers) kunnen vervolgens via een website of andere methodes zoekopdrachten sturen om vervolgens antwoord te krijgen van de GSA.

Dit heeft alleen weinig te maken met toegang van buitenaf omdat de indexering van de website gebeurt door een machiene die in de lokale omgeving van een bedrijf draait en dus niet door de "algemene" googlebot voor je normale google.com zoekopdrachten.

Zie ook http://www.google.com/enterprise/search/gsa_website.html.
(En nee, ze hangen geen Goudse kaas in je rack :+)

expert exchange doet dat ook, erg irritant!

ja, dat is inderdaad een verneukeratieve site. Maar via de Google cache vind je altijd het antwoord, koekje van eigen deeg :)

Gewoon helemaal omlaag scrollen voldoet ook?

Ja, gelukkig wel.
Maar omdat je eerst nog een hele rij referrers krijgt, denken mensen al gauw dat zo op het eind van de pagina zijn. En melden zich aan.
Je moet echt heel lang naar beneden scrollen wil je de resultaten krijgen.

Ik dacht ook een hele lange tijd dat het een ***** site was die de content afschermde. Nu weet ik gelukkig beter en scroll gelijk helemaal naar beneden :)

doorgaans helpt het door helemaal naar onder te scrollen :-)
(of hev ik toch een hack actief?)

Een tijd geleden heeft Google geklaagd dat ze de zoekrobot andere content voorschotelen dan de gebruiker.
Om in de zoekresultaten te blijven, heeft EE de content alsnog zichtbaar moeten maken voor de gebruiker. Echter zijn ze niet zo dom, en hebben ze de antwoorden helemaal onderaan gezet.

en daarnaast werkt dit alleen als je rechtstreeks bij google vandaan komt. een link naar een ander topic op EE vanuit EE werkt niet op deze manier.

Kan ze op een behoorlijke penalty van Google komen te staan overigens.
Dat zou ik toch graag wat uitgelegd willen hebben. Google die straf uitdeelt?
Als Google ongevraagd informatie van mijn site indexeert, dan moet men toch niet gaan klagen dat ze de verkeerde informatie vergaren?

Straffen kan ook in de vorm van een lagere index score geven. En als een site merkt dat zijn bezoekers via google spontaan met 40% afnemen (of misschien wel meer) dan zullen er snel genoeg achter komen dat ze lager staan en als ze dan verhaal gaan halen weten ze waarom.

Ik denk dat het met die penalty best meevalt. Als ik resultaten van een forum krijg die alleen voor Google leesbaar zijn, zit er vaak ook geen cache knopje op Google. Dat lijkt me niet per ongeluk.

Beetje offtopic,

Maar robots.txt vind ik persoonlijk een behoorlijk potentieel beveiligingsprobleem. Omdat robots.txt file een textbestand is kan iedereen de file gewoon in een browser downloaden. Als je gedetailleerd gaat opgeven welke mappen een gebruiker wel of niet mag bezoeken heeft iemand met potentieel slechte bedoelingen als een idee naar en in welke mappen hij of zij moet zoeken. Daarnaast kan een spider robots.txt gewoon negeren. Ik vind gebruik van robots.txt not done.

Maar robots.txt vind ik persoonlijk een behoorlijk potentieel beveiligingsprobleem.
Dan ga je voorbij aan het doel van robots.txt: het sturen van zoekmachines die voldoen aan die richtlijn. Het is nooit bedoeld geweest en is nog steeds niet bedoeld om er iets mee te beveiligen!
Omdat robots.txt file een textbestand is kan iedereen de file gewoon in een browser downloaden. Als je gedetailleerd gaat opgeven welke mappen een gebruiker wel of niet mag bezoeken heeft iemand met potentieel slechte bedoelingen als een idee naar en in welke mappen hij of zij moet zoeken.
Dat is maar gedeeltelijk waar. Ten eerste geef je een soort lijst van matches waar URLs aan moeten voldoen om ze te weren uit de index. Dat kan dus bijvoorbeeld door '/forum/profile-' op te geven, waardoor gebruikersprofielen niet worden geïndexeerd. Nogmaals, je beveiligt er niks mee, maar je voorkomt gewoon in dit voorbeeld dat de profielen van gebruikers op het forum minder makkelijk vindbaar zijn met de meeste zoekmachines.
Daarnaast kan een spider robots.txt gewoon negeren. Ik vind gebruik van robots.txt not done.
Tuurlijk kan een zoekmachine dat, maar ondertussen doen wel alle grote spelers mee in die richtlijnen en heb je als webmaster wel redelijk invloed op wat er wordt geïndexeerd.

Nieuw sites doen dat inderdaad vaker. Thegve geeft aan dat ze aan de "echte" gebruikers andere content geevn. Google vindt dat inderdaad niet leuk en zal maatregelen nemen als men dit doet om een hogere ranking te krijgen. Wat men wel vaak doet en wat Google ook toestaat is de Googlebot toegang geven tot een afgeschermd stuk, waar de normale gebruikers voor moeten betalen. De google bot kan dan indexeren en als gebruikers op de link klikken wordt hen gevraagd eerst te registreren of te betalen. Het doel is om Google wel te laten weten dat je bepaalde informatie op jouw betaal / afgeschermde site hebt staan.

Nieuwssites wel ja, maar waarom zou een site als die van de GPD dat doen?

Je hebt een google search engine kastje voor intranet sites. Je eigen google server zeg maar. Wellicht gebruikt de gpd zo'n search engine kastje, en is de search engine/bot op dat kastje hetzelfde als de Google bot die wij allemaal wel kennen. Zo zou het in principe kunnen dat de publieke Google bot via robots.txt toegang krijgt.
Edit: dat kastje heet de Google Search Appliance

[Reactie gewijzigd door Grrmbl op woensdag 12 augustus 2009 21:21]


Het is toch altijd hetzelfde verhaal? Door automatisering maken we gegevens toegankelijker, maar niet altijd op de manier die we bedoelden...
Denk ook aan de RFID-chips: makkelijk want geen direct contact meer nodig tussen kaart en lezer! Ondertussen heb ik van het bedrijf waar ik voor werk, wel een anti-skimpashouder gekregen. :)

Ik heb het even geprobeerd, maar ik vind niets meer]

T lukt mij ook niet echt...

Het lukt wel. Ik weet alleen niet of tweakers.net het leuk vind als ik naar de query link.
Alhoewel het hun eigen stomme fout is ;)

Indirecte non-clickable link dan: kijk eens op Geenstijl, daar zijn ze wat explicieter. :)

als ik dat invul gebeurd er bij mij niets |:(

Via cache van Google zijn ze nog wel te bereiken. Ze kunnen dus beter een nieuw nummer aanvragen want nu kan iedereen in principe het nummer achterhalen. 8)7

Ben ik wel benieuwd hoe t.net dit ontdekt heeft. Lijkt me niet dat ze elk ip-adres (dat zijn er met ipv4 best een boel, met ipv6 net nog wat meer) in google gaan typen om te kijken of er interessante resultaten tussen zitten :D

Het nummer van geert wilders staat nog gewoon in de cache van Google.

Die gaat een nieuw nummer aanvragen.

edit: ook het nummer van bijv gerard joling staat erin. Gaat heel beroemd Nederland nu nieuwe nummers aanvragen :')

[Reactie gewijzigd door cumulus007 op woensdag 12 augustus 2009 16:08]


de cache ervan lijkt niet meer toegankelijk te zijn, maar het nummer is wel te vinden via zoekresultaten...

enkel staat direkt ernaast 'Functie: VVD.', wat me doet vermoeden dat het héél oude informatie en waarschijnlijk zeker niet meer actueel

Beetje met commando's spelen en ik heb de volledige gegevens van GW al.

Al? je bent 1 van de langzaamste zo te zien :P

Of ik las het nieuwsbericht wat later.

Wie heeft al even gebelt ter controle? :D

Wilders heeft een soort voicemail erop staan. :)


Wil je me niet steeds bellen?! Ik word er een beetje gek van. Oh wacht ff... ik heb nog een gek aan de lijn... |:(
«  1  2  3  4  5  6  7  »

Op dit item kan niet meer gereageerd worden.

Volgende 16:13 EA legt merknamen Populous en Theme Park vast
Vorige 15:13 Dynavox bouwt draagbare spraakcomputer voor gehandicapten
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011