Google integreert links naar Wayback Machine in zoekresultaten

De zoekmachine van Google is begonnen met het integreren van links naar de Wayback Machine van Internet Archive voor oudere versies van pagina's. De Wayback Machine vervangt de resultaten in cache, die gebruikers niet langer kunnen raadplegen.

Wayback Machine in Google-zoekresultaten

Om de functie te zien, kunnen gebruikers op de drie puntjes naast de kop van het zoekresultaat klikken, om vervolgens te klikken op 'meer over deze pagina', zegt Internet Archive. Daar verschijnen de links naar Wayback Machine, al werkten die bij een korte test van Tweakers nog niet. Vaak brengt Google een functie gefaseerd uit en duurt het langer voor alle gebruikers een bepaalde functie hebben.

Google heeft decennialang de functie aangeboden om een pagina in cache te gebruiken voor het geval de actuele pagina onbereikbaar of gewijzigd was. Nu die is verdwenen, vervangt de Wayback Machine die functie. Google zegt tegen 9to5Google dat de wijziging onder meer voor onderzoekers is.

Vorig nieuwsartikel Volgend nieuwsartikel

Door Arnoud Wokke

Redacteur Tweakers

Feedback • 11-09-2024 20:51 31

11-09-2024 • 20:51

Lees meer

Internet Archive getroffen door nieuw datalek via supportplatform Nieuws van 22 oktober 2024

Internet Archive is week na hack weer online Nieuws van 14 oktober 2024

Internet Archive neemt buitenlandse proefschriften van Universiteit Leiden over Nieuws van 10 oktober 2024

Internet Archive is slachtoffer van hack, data van miljoenen gebruikers gestolen Nieuws van 10 oktober 2024

Google is gestopt met tonen van cacheversies van websites in zoekresultaten Nieuws van 2 februari 2024

Meer producten en artikelen

Internet Google Internet Archive Zoekmachines

IT-banen

Meer vacatures

Reacties (31)

-Moderatie-faq

Wijzig sortering

SterkeYerke 11 september 2024 21:06

Dit betekent dus dat Google Cache niet meer bestaat? Erg jammer als dat klopt, want voorheen had je nog twee kansen om een oude pagina terug te vinden. Nu dus nog maar één.

hcQd @SterkeYerke • 12 september 2024 00:18

Je kunt nu nog altijd cache: voor de url typen, geen idee of dit in de toekomst verdwijnt.

De Nelis @SterkeYerke • 11 september 2024 21:17

nieuws: Google is gestopt met tonen van cacheversies van websites in zoekresu...

SterkeYerke @De Nelis • 12 september 2024 00:08

Dank! Blijkbaar gebruikte ik het dan toch minder dan ik dacht.

McBacon @SterkeYerke • 12 september 2024 09:00

Er zijn ook nog andere archiveringssites, dus je hebt meer dan 2 kansen zelfs. ;]

YopY @McBacon • 12 september 2024 10:11

Helaas hebben die niet de bekendheid (of de sponsors) van het Internet Archive

. Ik kan er zelf geeneen noemen bijvoorbeeld.

willemb2 @McBacon • 12 september 2024 15:25

Links?

McBacon @willemb2 • 12 september 2024 18:46

https://archive.is schijnt toch wel redelijk bekend te zijn. Wordt voor zover ik weet wel maar door 1 persoon beheerd, dat is wel een beetje een nadeel. Of https://archive.softwareheritage.org voor archieven van platformen zoals GitHub.

Verder heb je ook een soort protocol genaamd Memento en zijn er websites om zoekopdrachten uit te voeren tegen meerdere archieven, i.p.v. dat je dus overal zelf iedere keer opnieuw moet zoeken (zover er al eigen portals bestaan). Bijvoorbeeld op http://timetravel.mementoweb.org/about (HTTP ja

) zie je een lijst van een aantal "web archives" die zij gebruiken, die misschien wel een beetje obscuur/specialistisch zijn maar het kan net genoeg zijn om wel te vinden wat je zoekt. De lijst lijkt niet helemaal up to date, maar je snapt het idee.

willemb2 @McBacon • 14 september 2024 19:14

O, dank! Ik heb recent een paar sites overgenomen van iemand die plotseling is overleden en zit met wat raadsels over problemen die daar 2 jaar geleden zijn opgetreden en nu nog doorwerken. De Wayback Machine heeft veel voorpagina's en andere vaste pagina's, maar zelden blogberichten.
archive.is heeft van mijn sites nog veel minder. Met Time Travel ga ik nog een regenachtige zondagmiddag doorstoeien.

P.S. mijn moeder heet geen Henk

Opperpanter2 11 september 2024 21:07

Ik ben benieuwd of de wayback machine al dat extra traffic aan kan.

3raser @Opperpanter2 • 12 september 2024 08:30

Ik mag hopen dat Google met deze stap ook een stukje datacenter sponsort zodat de wayback machine wat soepeler gaat draaien.

YopY @3raser • 12 september 2024 10:13

idd, Google heeft zoveel geld in kas, een omzet van 300 miljard per jaar, daar kunnen ze wel een groot deel doneren aan het IA. Ik vind het van de zotte dat bijvoorbeeld regeringen en bedrijven enorm veel geld uitgeven aan het archiveren van bijvoorbeeld wat er op TV of in de kranten is, maar dat het internet aan een vrijwilligersorganisatie overgelaten wordt.

alt-92 @YopY • 12 september 2024 13:15

Ik vraag me ook af hoeveel geld ze besparen met het uitzetten van een deel van het serverpark (storage) waar die cache op draaide.

d3burt

@alt-92 • 12 september 2024 17:00

Die cache hebben ze nog altijd voor de zoekmachine zelf nodig... Het is uitgezet omdat de cache steeds minder goed werkte, onder andere omdat steeds meer content client side wordt gerenderd door JavaScript, wat vaak mis gaat vanuit de cache links.

Door nu naar het Internet Archive te verwijzen klagen mensen niet meer bij Google als het niet werkt, en dat is hun winst.

Overigens staat me er iets van bij dat Google best een grote donor is van de Internet Archive.

Navi @Opperpanter2 • 11 september 2024 21:08

Ik ook, de site is altijd al wat traag geweest.

b12e @Navi • 11 september 2024 21:17

Een week of twee terug nog erger, constant 50X errors. 10x herladen om (een sectie van) de pagina te laten werken.

Blijkbaar is de jaarlijkse calendar view en de timeline erboven 2 aparte iframes die beide, of een van de 2, een 50X kan geven. En als je dan eindelijk een datum gevonden hebt waar de info staat die je nodig hebt, dan kan die ook nog eens 50X'en.

't was dat de info belangrijk was, anders had ik zoveel geduld niet gehad.

closefuture 11 september 2024 21:17

De Wayback machine is van the Internet Archive. Met een beetje pech bestaat the Internet Archive straks niet meer: https://www.wired.com/sto...chette-books-case-appeal/

TLDR; The Internet Archive vond dat ze boeken moesten gaan archiveren en mochten gaan fungeren als een digitale bibliotheek. Zo'n beetje iedereen zei tegen ze dat dat slecht ging aflopen als het voor een rechter zou komen. Nu zien we de ontknoping van die afloop.

Persoonlijk vind ik dat ze speelde met vuur en dat het totaal onverantwoord was om te doen. Het brengt zaken zoals the Wayback machine in gevaar.

[Reactie gewijzigd door closefuture op 11 september 2024 21:18]

kuurtjes @closefuture • 11 september 2024 22:13

Het was een reactie tegenover het onderdrukken van digitale archivering.

Het was inderdaad een riskante keuzen, maar het belangrijkste is dat ze toch iets hebben geprobeerd om vrijheid van informatie te waarborgen.

closefuture @kuurtjes • 11 september 2024 22:46

Ik heb het wellicht wat ongelukkig geformuleerd.

Het archiveren van boeken ansich is nog niet eens het probleem. Het probleem is dat ze tijdens Corona hun digitale leen systeem hebben uitgeschakeld zodat boeken "ongelimiteerd" uitgeleend konden worden.

Iedereen kon natuurlijk bedenken dat dat nooit ging werken als ze daarvoor aangeklaagd zouden worden.

Jerie

@kuurtjes • 12 september 2024 00:23

Volgens mij was het ontstaan in de coronatijd om mensen toegang te geven tot leesvoer tijdens de pandemie / lockdown.

Wat betreft deze feature. Ik gebruik deze feature al tijden in Kagi. Werkt erg prettig. Ik zal toegeven dat de Google Cache soms soms wel 'ns content heeft die een wayback machine (Archive.org of Archive.today) niet op tijd hebben weten te mirroren. Het is trouwens ook handig om te gebruiken als je een bepaalde website niet wilt bezoeken vanuit je eigen IP adres (ik pas het bijvoorbeeld toe bij .ru domeinen en Russische CIDR ranges).

[Reactie gewijzigd door Jerie op 12 september 2024 00:23]

Afgeleide 11 september 2024 21:06

Betekent dit ook dat Google meebetaalt aan de wayback machine?

i7x @Afgeleide • 11 september 2024 21:16

Denk het wel, gebeurt met Wikipedia ook. Is wel echt een voordeel wat mij betreft, dat zulke diensten op die manier wat beter overeind gehouden worden.

YopY @Afgeleide • 12 september 2024 10:31

Ik heb even gezocht maar ik kon geen "corporate" sponsors vinden op de IA website, waarschijnlijk is dat met opzet om inmenging / marketing te voorkomen?

Wat ik wel langs zien komen is dat Google sponsor is van the HTTP archive, een onderdeel van het IA dat zich meer op de technische geschiedens (performance over tijd) richt; sponsorship van HTTP Archive gaat via Internet Archive.

PaPi36 11 september 2024 20:58

Toevallig dinsdag voor het eerst die site gebruikt om een artikel terug te vinden over de revolutie periode in Indonesië. Stond op een site die niet meer in de lucht is waarschijnlijk omdat de eigenaar een paar jaar geleden overleden is. Kostte even tijd maar is gelukt. Geweldig dat het bestaat en wordt nog fijner als Google het opneemt in de zoek resultaten.

Server.1968 11 september 2024 22:27

Offtopic een beetje: Ik doneer toch €5,- p/m. Hoop dat 't helpt om de Internet Archive overeind te houden. Zou bijzonder vervelend zijn als 't ophield te bestaan, net zoiets als Wikipedia dat ermee ophoudt.

[Reactie gewijzigd door Server.1968 op 11 september 2024 22:28]

SpeelStation 12 september 2024 08:58

Inmiddels werkt het wel, iig voor de tweakers website; na klikken op de drie bolletjes, klik je op 'meer over deze pagina' en scroll dan helemaal naar onderen voor 'Vorige versies bekijken op Internet Archive'.

De link gaat echter naar https://web.archive.org/web/2if_/https://tweakers.net/, wat doorlust naar de meest recent gecachete versie van Internet Archive. Dat is logisch, want voor de meeste gebruikers prima, maar als tweaker zou ik het fijner vinden om naar de overzichtspagina https://web.archive.org/web/20240000000000*/tweakers.net te gaan, zodat je zelf een punt in de geschiedenis kunt uitzoeken.

KipKroket 12 september 2024 01:01

Google heeft decennialang de functie aangeboden om een pagina in cache te gebruiken ... Nu die is verdwenen

Het is nog steeds mogelijk om cache:url in de zoekbalk te typen om de pagina in cache weer te geven, bijvoorbeeld cache:tweakers.net. Gaat deze optie ook verdwijnen?

[Reactie gewijzigd door KipKroket op 12 september 2024 01:04]

DummyXL 12 september 2024 07:49

Mijn oude prive site staat daar nog op kwam ik een maand geleden achter, heel gaaf. Die is in 2000 offline gegaan en ik heb geen Backup. Ik heb alleen geen idee hoe ik hem kan downloaden dat zou ik nu wel willen doen.

carpcatcher @DummyXL • 12 september 2024 10:00

check dos curl --help

zou iets moeten zijn als
curl -k -o C:\local\index.html https://tweakers.net/tedownloadenpagina.html

Kroesss 12 september 2024 07:55

Op zich ben ik wel fan van de Wayback Machine. Het enige is dat ze verzoeken om specifieke pagina's met prive-informatie te verwijderen altijd compleet negeren. Ik heb in ieder geval nog nooit een reactie gekregen. Dat is wel echt een serieus nadeel omdat dit identiteitsfraude in de hand werkt.

Op dit item kan niet meer gereageerd worden.

Lees meer

IT-banen

Reacties (31)

Sorteer op:

Weergave: