Hoofdcategorieën
Device Settings

Omzeilen van registratie en betaling van sites dankzij Google

Door Tamara van Hal, maandag 12 juli 2004 16:41
Bron: WebWereld, views: 36.767

Beveiligingsexpert Martijn Brinkers heeft een manier gevonden om zonder registratie of betaling binnen te komen bij sites waarvoor dit normaal wel nodig is. Hiervoor maakt hij gebruik van de gegevens van Googles zoekrobot, zo lezen we op WebWereld. Veel van de registratiesites houden een achterdeur open voor de zoekrobot, zodat zij toch opgenomen kunnen worden in Googles database. Om zelf zonder registratie de sites te kunnen bezoeken is het dus voldoende om de zoekrobot na te bootsen.

loep (zoeken)Dit is te doen door in de browser de user agent aan te passen in Googlebot/2.1 (+http://www.googlebot.com/bot.html). Er zijn voor de verschillende browsers speciale programma’s beschikbaar om de user agent aan te passen. Niet alleen registratie is zo te omzeilen, ook sites waarvoor normaliter abonnementsgeld moet worden betaald zijn op deze manier gratis te bezoeken. Deze truc werkt echter niet bij alle sites; de New York Times bijvoorbeeld presenteert nog steeds een inlogscherm.

Brinkers denkt dat deze site gebruik maakt van een extra controle, zoals het controleren op IP-adres. Brinkers’ actie komt waarschijnlijk voort uit onvrede over de werkwijze van de registratiesites: hij noemt het zoekmachinevervuiling, omdat hij niet zonder meer terecht kan op de resultaten die Google tevoorschijn tovert. Hij zegt dat het mogelijk zou moeten zijn om de resultaten te filteren op toegankelijkheid. Omdat men hiervoor afhankelijk is van de sitebouwer die dit in de meta-tags moet aangeven, noemt hij dit echter een onrealistische wens.

Volgende 18:46 StorageTek gebruikt DMCA voor monopolie op onderhoud
Vorige 16:10 Intels plannen voor derde en vierde kwartaal op een rij gezet
Advertentie

Reacties

«  1  2  3  4  »

Dat wordt dus gratis p*orn :*)

gratis ? hmmm er zijn meer manieren hoor .. ze zijn stuk voor stuk illigaal .. teminste het kan legaal zijn als je het anders bekijkt ;) uit technisch oogpunt of uit het mis/ge-bruik ervan

valt tegen, de sites die ik geprobeerd heb laten je OF niet toe op een members pagina, of ze hebben een "easy convenient bookmark page" waarna je alsnog moet inloggen...

De meeste porn sites werken gewoon met een grote automatisch updatende htpasswd/htaccess (via het 3rd party billing bedrijf).

Verder hebben dit soort sites er ook geen baat bij om de 'content' toegankelijk te maken voor google (geen tekst om de indexen, en de afbeeldingen willen ze uiteraard niet gecached hebben).

Gratis porn zul je dus elders moeten zoeken ;)

Hier voorbeeldje van dynamische robots.txt:
RewriteEngine on
RewriteRule robots.txt /robots.php [L]
en
<? header('Content-Type: text/plain'); echo("User-agent: " . strtolower(strtok($_SERVER['HTTP_USER_AGENT'], '/')) . "\r\n"); echo("Allow: /\n"); ?>

Dan doe je wel erg moeilijk :)
als je gewoon even op kazaa (naar mijn mening de grootste porno zoekmachine van alle)
denk ik dat je meer kan downloaden dan de grootste porn site van de wereld

Kazaa :r

Doe maar usenet dan... mits je toegang hebt tot een fatsoenlijke binaries server.

Dit is toch al eeuwen bekend?

Ik houd websites al tijden voor de gek op deze manier :/

Net nog in google hetzelfde geval gehad, ik gebruik in dat geval de "in cache" link om de info toch te lezen. Leuk dat het op deze manier ook kan.

Voor webmasters bestaat de mogelijkheid om via <META NAME="ROBOTS" CONTENT="NOARCHIVE"> de in-cache-optie bij zoekmachines uit te schakelen.

Veel betaalde sites maken (helaas) van deze mogelijkheid gebruik.

Zoekmachines lezen toch robot.txt uit en al tijden niet meer de meta tags. Of vergis ik me?

Wappie, het is idd een fabeltje dat je zoekmachines kunnen leiden met metatags. Alhoewel ze er nog wel wat mee doen, wegen ze lang niet zo zwaar meer als vroeger. Dit is uiteraars weer te danken aan de "webmasters" die er wel eventjes misbruik van gingen maken.

Je vergist je:
http://www.google.com/bot.html
bij google, waar het hier om gaat, lukt dat wel zeker.

Tsja, het is nu leuk om bijna alle kranten te lezen..

Het werkt zeer goed in combinatie met bugmenot.com

Hmmm, je hebt nog maar 2 punten gekregen, terwijl bugmenot.com echt IDEAAL is!
Er bestaat zowel een IE als een Mozilla plug-in (ze noemen 't een extension) en wanneer je ergens op een site staat waar registratie verplicht is, klik je met de rechtermuisknop en kiest "bugmenot". Vervolgens wordt er door dit tooltje vanaf een database van bugmenot.com login informatie (username en password) gehaald die daar door andere bugmenot gebruikers ingezet is. Zo kun je naar www.volkskrant.nl gaan en met een "bugmenot username" inloggen om alle nieuwsitems te lezen!

Er bestaan zelfs bugmenot mailadressen! Met een beetje zoeken vind je ze wel :Y)

Tja, nu dit ontdekt is zullen de kranten het waarschijnlijk vrij snel gaan blokkeren.

Werkt ook prima bij de New York Times ... gewoon &partner=google achter de url aanplakken ...

sry voor mijn n00bheid maar dat van de NY Times werkt niet bij mij...hij vraagt gewoon om in te loggen of te registreren...

Je lijkt gelijk te hebben: de 'functionaliteit' is uitgeschakeld lijkt het... :'(

Googlebot/2.1 (+http://www.googlebot.com/bot.hrml...
Dat moet natuurlijk html zijn :+

Gratis pornosites B-)

Er staat wel een minuscuul foutje in de user agent, er mist aan het eind nog een ')' :).
Googlebot/2.1 (+http://www.googlebot.com/bot.html)
Zelf heb ik dit ook even gecontroleerd (uit wetenschappelijke insteresse natuurlijk :P) met de firefox plugin "User Agent Switcher", met de googlebot U.A. kon ik zonder in te loggen de artikelen op www.volkskrant.nl lezen (waarvoor je dus eigenlijk moet inloggen, wat overigens wel gratis is).

Edit:
Naast de volkskrant werkt dit ook op:
- www.nrc.nl
- www.telegraaf.nl
- www.ad.nl

Er staat wel een minuscuul foutje in de user agent
Er staat er nog eentje in:
Googlebot/2.1 (+http://www.googlebot.com/bot.hrml.
Het is .html ipv .hrml... ;) Maar dit had je in je eigen versie al verbeterd...
«  1  2  3  4  »

Op dit item kan niet meer gereageerd worden.

Volgende 18:46 StorageTek gebruikt DMCA voor monopolie op onderhoud
Vorige 16:10 Intels plannen voor derde en vierde kwartaal op een rij gezet
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011