Google integreert links naar Wayback Machine in zoekresultaten

De zoekmachine van Google is begonnen met het integreren van links naar de Wayback Machine van Internet Archive voor oudere versies van pagina's. De Wayback Machine vervangt de resultaten in cache, die gebruikers niet langer kunnen raadplegen.

Wayback Machine in Google-zoekresultaten
Wayback Machine in Google-zoekresultaten

Om de functie te zien, kunnen gebruikers op de drie puntjes naast de kop van het zoekresultaat klikken, om vervolgens te klikken op 'meer over deze pagina', zegt Internet Archive. Daar verschijnen de links naar Wayback Machine, al werkten die bij een korte test van Tweakers nog niet. Vaak brengt Google een functie gefaseerd uit en duurt het langer voor alle gebruikers een bepaalde functie hebben.

Google heeft decennialang de functie aangeboden om een pagina in cache te gebruiken voor het geval de actuele pagina onbereikbaar of gewijzigd was. Nu die is verdwenen, vervangt de Wayback Machine die functie. Google zegt tegen 9to5Google dat de wijziging onder meer voor onderzoekers is.

Door Arnoud Wokke

Redacteur Tweakers

11-09-2024 • 20:51

31

Reacties (31)

31
31
16
2
0
15
Wijzig sortering
Dit betekent dus dat Google Cache niet meer bestaat? Erg jammer als dat klopt, want voorheen had je nog twee kansen om een oude pagina terug te vinden. Nu dus nog maar één.
Je kunt nu nog altijd cache: voor de url typen, geen idee of dit in de toekomst verdwijnt.
Dank! Blijkbaar gebruikte ik het dan toch minder dan ik dacht.
Er zijn ook nog andere archiveringssites, dus je hebt meer dan 2 kansen zelfs. ;]
Helaas hebben die niet de bekendheid (of de sponsors) van het Internet Archive :/. Ik kan er zelf geeneen noemen bijvoorbeeld.
https://archive.is schijnt toch wel redelijk bekend te zijn. Wordt voor zover ik weet wel maar door 1 persoon beheerd, dat is wel een beetje een nadeel. Of https://archive.softwareheritage.org voor archieven van platformen zoals GitHub.

Verder heb je ook een soort protocol genaamd Memento en zijn er websites om zoekopdrachten uit te voeren tegen meerdere archieven, i.p.v. dat je dus overal zelf iedere keer opnieuw moet zoeken (zover er al eigen portals bestaan). Bijvoorbeeld op http://timetravel.mementoweb.org/about (HTTP ja ;() zie je een lijst van een aantal "web archives" die zij gebruiken, die misschien wel een beetje obscuur/specialistisch zijn maar het kan net genoeg zijn om wel te vinden wat je zoekt. De lijst lijkt niet helemaal up to date, maar je snapt het idee. :D
O, dank! Ik heb recent een paar sites overgenomen van iemand die plotseling is overleden en zit met wat raadsels over problemen die daar 2 jaar geleden zijn opgetreden en nu nog doorwerken. De Wayback Machine heeft veel voorpagina's en andere vaste pagina's, maar zelden blogberichten.
archive.is heeft van mijn sites nog veel minder. Met Time Travel ga ik nog een regenachtige zondagmiddag doorstoeien.

P.S. mijn moeder heet geen Henk 8-)
Ik ben benieuwd of de wayback machine al dat extra traffic aan kan.
Ik mag hopen dat Google met deze stap ook een stukje datacenter sponsort zodat de wayback machine wat soepeler gaat draaien.
idd, Google heeft zoveel geld in kas, een omzet van 300 miljard per jaar, daar kunnen ze wel een groot deel doneren aan het IA. Ik vind het van de zotte dat bijvoorbeeld regeringen en bedrijven enorm veel geld uitgeven aan het archiveren van bijvoorbeeld wat er op TV of in de kranten is, maar dat het internet aan een vrijwilligersorganisatie overgelaten wordt.
Ik vraag me ook af hoeveel geld ze besparen met het uitzetten van een deel van het serverpark (storage) waar die cache op draaide.
Die cache hebben ze nog altijd voor de zoekmachine zelf nodig... Het is uitgezet omdat de cache steeds minder goed werkte, onder andere omdat steeds meer content client side wordt gerenderd door JavaScript, wat vaak mis gaat vanuit de cache links.

Door nu naar het Internet Archive te verwijzen klagen mensen niet meer bij Google als het niet werkt, en dat is hun winst.

Overigens staat me er iets van bij dat Google best een grote donor is van de Internet Archive.
Ik ook, de site is altijd al wat traag geweest.
Een week of twee terug nog erger, constant 50X errors. 10x herladen om (een sectie van) de pagina te laten werken.

Blijkbaar is de jaarlijkse calendar view en de timeline erboven 2 aparte iframes die beide, of een van de 2, een 50X kan geven. En als je dan eindelijk een datum gevonden hebt waar de info staat die je nodig hebt, dan kan die ook nog eens 50X'en.

't was dat de info belangrijk was, anders had ik zoveel geduld niet gehad.
De Wayback machine is van the Internet Archive. Met een beetje pech bestaat the Internet Archive straks niet meer: https://www.wired.com/sto...chette-books-case-appeal/

TLDR; The Internet Archive vond dat ze boeken moesten gaan archiveren en mochten gaan fungeren als een digitale bibliotheek. Zo'n beetje iedereen zei tegen ze dat dat slecht ging aflopen als het voor een rechter zou komen. Nu zien we de ontknoping van die afloop.

Persoonlijk vind ik dat ze speelde met vuur en dat het totaal onverantwoord was om te doen. Het brengt zaken zoals the Wayback machine in gevaar.

[Reactie gewijzigd door closefuture op 11 september 2024 21:18]

Het was een reactie tegenover het onderdrukken van digitale archivering.

Het was inderdaad een riskante keuzen, maar het belangrijkste is dat ze toch iets hebben geprobeerd om vrijheid van informatie te waarborgen.
Ik heb het wellicht wat ongelukkig geformuleerd.

Het archiveren van boeken ansich is nog niet eens het probleem. Het probleem is dat ze tijdens Corona hun digitale leen systeem hebben uitgeschakeld zodat boeken "ongelimiteerd" uitgeleend konden worden.

Iedereen kon natuurlijk bedenken dat dat nooit ging werken als ze daarvoor aangeklaagd zouden worden.
Volgens mij was het ontstaan in de coronatijd om mensen toegang te geven tot leesvoer tijdens de pandemie / lockdown.

Wat betreft deze feature. Ik gebruik deze feature al tijden in Kagi. Werkt erg prettig. Ik zal toegeven dat de Google Cache soms soms wel 'ns content heeft die een wayback machine (Archive.org of Archive.today) niet op tijd hebben weten te mirroren. Het is trouwens ook handig om te gebruiken als je een bepaalde website niet wilt bezoeken vanuit je eigen IP adres (ik pas het bijvoorbeeld toe bij .ru domeinen en Russische CIDR ranges).

[Reactie gewijzigd door Jerie op 12 september 2024 00:23]

Betekent dit ook dat Google meebetaalt aan de wayback machine?
Denk het wel, gebeurt met Wikipedia ook. Is wel echt een voordeel wat mij betreft, dat zulke diensten op die manier wat beter overeind gehouden worden.
Ik heb even gezocht maar ik kon geen "corporate" sponsors vinden op de IA website, waarschijnlijk is dat met opzet om inmenging / marketing te voorkomen?

Wat ik wel langs zien komen is dat Google sponsor is van the HTTP archive, een onderdeel van het IA dat zich meer op de technische geschiedens (performance over tijd) richt; sponsorship van HTTP Archive gaat via Internet Archive.
Toevallig dinsdag voor het eerst die site gebruikt om een artikel terug te vinden over de revolutie periode in Indonesië. Stond op een site die niet meer in de lucht is waarschijnlijk omdat de eigenaar een paar jaar geleden overleden is. Kostte even tijd maar is gelukt. Geweldig dat het bestaat en wordt nog fijner als Google het opneemt in de zoek resultaten.
Offtopic een beetje: Ik doneer toch €5,- p/m. Hoop dat 't helpt om de Internet Archive overeind te houden. Zou bijzonder vervelend zijn als 't ophield te bestaan, net zoiets als Wikipedia dat ermee ophoudt.

[Reactie gewijzigd door Server.1968 op 11 september 2024 22:28]

Inmiddels werkt het wel, iig voor de tweakers website; na klikken op de drie bolletjes, klik je op 'meer over deze pagina' en scroll dan helemaal naar onderen voor 'Vorige versies bekijken op Internet Archive'.

De link gaat echter naar https://web.archive.org/web/2if_/https://tweakers.net/, wat doorlust naar de meest recent gecachete versie van Internet Archive. Dat is logisch, want voor de meeste gebruikers prima, maar als tweaker zou ik het fijner vinden om naar de overzichtspagina https://web.archive.org/web/20240000000000*/tweakers.net te gaan, zodat je zelf een punt in de geschiedenis kunt uitzoeken.
Google heeft decennialang de functie aangeboden om een pagina in cache te gebruiken ... Nu die is verdwenen
Het is nog steeds mogelijk om cache:url in de zoekbalk te typen om de pagina in cache weer te geven, bijvoorbeeld cache:tweakers.net. Gaat deze optie ook verdwijnen?

[Reactie gewijzigd door KipKroket op 12 september 2024 01:04]

Mijn oude prive site staat daar nog op kwam ik een maand geleden achter, heel gaaf. Die is in 2000 offline gegaan en ik heb geen Backup. Ik heb alleen geen idee hoe ik hem kan downloaden dat zou ik nu wel willen doen.
check dos curl --help

zou iets moeten zijn als
curl -k -o C:\local\index.html https://tweakers.net/tedownloadenpagina.html
Op zich ben ik wel fan van de Wayback Machine. Het enige is dat ze verzoeken om specifieke pagina's met prive-informatie te verwijderen altijd compleet negeren. Ik heb in ieder geval nog nooit een reactie gekregen. Dat is wel echt een serieus nadeel omdat dit identiteitsfraude in de hand werkt.

Op dit item kan niet meer gereageerd worden.